2020 DATATHON 數據松

2020 DATATHON 數據松

活動時間: 2020-08-10 ~ 2020-08-31

主辦單位: 經濟部工業局

如果您…
累積了數據分析技能,正在尋找一個磨練運用的場合
對資料充滿熱情,想認識高手、認識志同道合的夥伴
想認識用數據賺錢的公司,一窺私有資料​​
運用您的看家本領建立合作機會

2020 DATATHON 數據松

首場私有資料+資料疊合 2020 DATATHON
找好隊友來報名吧

「2020 DATATHON數據松」由經濟部工業局主辦,財團法人資訊工業策進會執行,以鼓勵跨領域資料多元疊合的理念出發,提供企業內部真實數據資料,包括社群輿情資料、消費行為數據、氣象資料,誠摯邀請各路好手來一同玩數據!

​本活動適合程式開發、資料科學、數據分析、設計相關專業背景之工程師、新創團隊或學生參加,想一睹商業資料的秘辛,玩出不一樣的市場分析結果,或者做為未來求職的跳板,你一定不能錯過2020 DATATHON 數據松

​***主辦單位保留視情況調整、取消活動之權利

數據主題 Hacking with DATA!

[2020數據松] Data集合啦!資料創新大會

  • 主題內容:本次數據松活動邀請企業提供今年1到6月份不同來源的資料,以時間、地點或其他維度為主軸進行堆疊,涵蓋了不同季節、議題與消費行為,期待能以異質的資料碰撞出新的火花,展現Data fusion帶來的價值與新洞見,或發展能改變生活或發展商業機會的新應用。
  • ​​資料使用:必須使用2種以上之「企業提供data」+「其他data」( 可使用不同企業之data、提前自備、自行蒐集,或使用open data )
  • ​作品:以互動型的資料呈現,或web/app應用呈現

活動資料內容說明

全台每小時天氣觀測資料集

資料集簡介​

由天氣風險蒐集全台灣的氣象觀測數據,氣象觀測最早從1885年開始,迄今已有一百多年歷史,本次活動提供今年1~6月份經過資料校正的觀測資料,有21項欄位,將近260萬筆資料,包含中央氣象局、經濟部水利署及農委會水保局佈建的氣象測站,多達606個測站,觀測儀器大致分三種,由人工觀測的局屬觀測站,以及完全由儀器觀測的自動氣象站和自動雨量站。

提供者-天氣風險管理開發

天氣風險公司為台灣第一家民間氣象公司,成立於2003年,擁有政府核發的氣象與海象預報證照。推動台灣的氣象產業,致力於氣象加值服務,目前將氣象資料成功應用於防災、企業風險管理、氣象經濟、氣候評估、媒體傳播及環境教育等服務。主要服務客戶跨及媒體、運輸、製造、物流、通路等超過300家民間企業及各政府機關。

電子發票消費資料集

資料集簡介​

發票來源:自『發票怪獸App』蒐集到的無記名發票資料
筆數:約 1000萬筆
隨機取樣方式:以系統會員uuid末一碼當做過濾條件,撈取對象的全部發票資料

提供者-春樹科技( 發票怪獸 )

定位 = Martech = 懂廣告的科技公司,有數據平台的廣告公司。
近三年獎項:動腦雜誌年度行銷傳播傑出貢獻獎、4A廣告獎、時報廣告金像獎、動腦雜誌廣告行銷10大金句獎、數位奇點獎最佳AI應用獎、最佳產品獎、最佳互動獎、廣告雜誌年度十大廣告案例、大中華區艾菲獎季節營銷獎入圍…

網路輿情發文來源資料集

資料集簡介​

網路輿情發文來源資料集,為公開性網路輿情出現時的發佈來源、出現時間、URL。本資料集為JSON格式。

提供者-藍星球資訊

藍星球資訊股份有限公司創立於2013年,組成兼具「資訊」技術與「人文」精神的團隊,為國立臺灣大學官方正式技術轉移的科技公司,致力於數位化、詮釋資料分析、數位加值及資料庫檢索技術整合之服務與研發。

藍星球團隊專精中文資料處理,提供智慧化的文本分析、相似文件群集、前後文自動化串聯等文本探勘技術,有系統地處理非結構巨量資料內容,找出關鍵精華。服務領域包含語意分析技術導入、數位典藏系統、開放資料發佈平台、新聞與社群輿情口碑分析系統、企業開放資料整合平台等。

目前已推出「透事THOUGHTS雲端服務API」面向中文大數據分析市場;以及「蛛思CHOOSE輿情智慧分析平台」提供快速準確、多元分析、精緻圖表的口碑監測系統。近期將推出企業開放資料搜尋分析平台。


參加流程

01/ 提案報名

  • 組隊報名:以程式式開發、資料科學、數據分析、設計相關專業背景佳,不限資格,組建2-5人之團隊,並選出隊長擔任聯絡窗口。
  • 上傳提案簡報:報名時請一併附上提案簡報( 可參考本頁面格式 ),須包含團隊成員資料+提案內容。可依據各家廠商的Sample data做提案發想,並由隊長於報名截止日8月31日23:59前在本網頁線上報名( 以網站後台收到紀錄為準 )。
  • 確認報名成功:主辦單位將於收到線上提案通知後,三個工作天回覆報名確認通知,若有問題請與我們聯繫
  • ​準備參加數據松:初選將根據團隊的背景組成、資料運用及提案內容規劃進行評估,結果將於9/4公布。

02/ 參加DATATHON挑戰自我

  • 入選團隊須於9月11日至9月13日出席,並於活動現場與資料提供業者簽訂「數據使用及保密同意書」,並繳交一組$500之押金( 活動發表完後簽收返回 ),始可取得數據松活動使用之資料。

03/ 作品發表

進度分享( 一組5 分鐘 ):可用簡報呈現目前進度、遭遇的技術問題或技術分享,亦可demo專案開發進度,以利說明。

成果上傳:作品發表於9月13日13:00成果發表前將「成果簡報」( 大會提供簡易格式,包含作品名稱、團隊名稱、團隊成員,並說明如何使用數據與驗證結果 )上傳至主辦單位指定空間

成果發表( 一組5分鐘,5分鐘QA + 講評 ):以簡報說明使用的資料集和解決的主題,可擷取分析成果的截圖加以說明團隊使用的分析技術。並透過demo專案內容( App、Web、ChatBot等形式 )展示疊合分析成果。

***主辦單位保留視情況調整、取消活動之權利

活動時間

09/11 18:00 – 09/13 18:00

活動場地

資策會 教研所
台北市信義路三段
( 待確認後通知參加團隊 )

現場供應

現場備有無線網路、電源插座、延長線、紙筆,請自備其他作品開發所需工具如筆電等

​精神

本活動鼓勵友善的交流開發風氣,歡迎團隊間互相討論成長,發揮共同合作,解決問題的精神

重要時程

8/10 開放線上報名提案

8/31 ​線上報名提案截止

9/4 ​初選名單公布

9/11 ​數據松開跑

活動流程

Day 1- 9/11 ( 五 )

時間 活動內容

17:00 ~ 18:00 參加者報到

18:00 ~ 18:10 活動開場

18:10 ~ 18:20 數據松主題說明

18:20 ~ 18:40 資料使用說明與下載

18:40 ~ Hack Time

Day 2- 9/12 ( 六 )

時間 活動內容

~ 12:00 Hack Time

12:00 ~ 13:00 午餐時間

13:30 ~ 15:30 進度分享

15:30 ~ 17:30 Hack Time

17:30 ~ 18:30 晚餐時間

18:30 ~ Hack Time

Day 3- 9/13 ( 日 )

時間 活動內容

~ 12:00 Hack Time

12:00 ~ 13:00 午餐時間

13:00 ~ 16:50 成果發表

16:50 ~ 17:05 人氣投票

17:05 ~ 17:20 頒獎,合照

17:20 ~ 18:00 交流時間

​評審

​宋浩
藍星球資訊總經理、東吳大學巨量資料管理學院兼任助理教授,擔任國家發展委員會開放資料平台( data.gov.tw )及臺北市政府開放資料平台( data.taipei )計畫主持人,專精於文字探勘、語意分析、檢索理論、軟體工程與資料庫系統。擁有超過二十年以上網站、軟體、APP開發經驗。

曾參與行政院10朵政府雲之中兩朵雲的開發作業、以及數位典藏與數位學習國家型科技計畫等國家級專案執行。

​謝孟格
現職於天氣風險公司,擔任資料分析師暨天氣分析師,同時也是氣象主播,熟悉各種氣象資料分析方法,用於防災及商品需求等應用經驗,擅長利用資料分析來解決客戶的天氣問題。

張麗卿
現職於春樹科技業務副總,負責發票怪獸數據應用業務,曾任職台灣最大的會員卡平台HAPPY GO負責數據行銷業務主管,數據行銷是運用海量數據了解消費者行為,從了解消費者到引導購買進而改變消費習慣,數據分析的結果可以協助行銷重要歷程的決策,數據真相的檢視更可以精準有效的產生適時適地的作法。

Bryan
現職資料解決方案架構師,在資料領域打滾十年有餘,協助企業用資料解決商業問題。

常見QA問題

1. 作品的著作權是誰的?

作品的著作權屬於參加團隊所有,不屬於主辦單位或資料提供廠商。唯於本活動中參賽團隊繳交之提案簡報、成果發表之簡報內容,執行單位得用於非獨占性的成果展示、宣傳,不會對參加者支付任何費用。

2. 數據松活動是競賽嗎? 有沒有獎金呢?參加者有什麼好處呢?

本活動的精神在激發創意,並沒有獎金,也不會是解決特定廠商的特定問題。但是可以磨練技巧,發想side project的機會,不僅可以挑戰自我,認識其他開發者,增進團隊默契,更可以透過本活動,接觸到真實應用於業界的高價值資料。若您本身也正在挖掘資料的價值,不妨帶著您自己的問題一起來Brainstorming吧!

3. 我適合參加嗎?一定要組隊報名嗎?

本活動以鼓勵性質為初衷,並不會嚴格規定作品的型態或精準度,歡迎對資料有興趣的人一起玩資料。但為了讓開發進度順利,提醒必須要組隊參加,並且在提案中說明團隊分工腳色。若還是不確定是否合適,也可以先參考各家提供的Sample data,根據欄位先做發想和測試。

4. 參加活動要錢嗎?

本活動為免費報名參加!但為提升活動品質,設有報名團隊數限制,額滿為止,請盡快報名!

5. 活動時間好長,我都要到場嗎?

在取得資料前,需要團隊簽署資料提供廠商的「資料使用及保密同意書」,需要到場才可以拿到資料,第三日的活動發表期間也請務必到場發表。此外活動期間也會有交流時間、免費點心或餐飲,您一定不想錯過!

6. 我想參加活動,要事先準備什麼嗎?​

現場備有電源、網路、紙筆,只需要將您開發用的筆電、隊友以及對資料的熱情帶來即可!目前場地並不提供夜宿,可以不用攜帶睡袋。

7. 肺炎疫情是否影響活動呢?

因應疫情,請大家配合量測體溫、噴酒精、戴上口罩,並配合實名制登記。若有疑似症狀請主動通知主辦單位,並得請您離場。若有因疫情調整場地或進行方式,主辦單位會另行通知。


相關連結:


相關檔案:


您可能也會喜歡…

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料