2021數字中國創新大賽.醫療大數據賽題

2021數字中國創新大賽.醫療大數據賽題

總獎金:160000(CNY)

最高獎金:100000(CNY)

報名時間:2021-02-20 ~ 2021-04-07

主辦單位:數字中國建設峰會組委會福建孟超肝膽醫院

主辦單位電話:+86-010-53973901

主辦單位Email:fhcxds@szzg.gov.cn

大數據賽道介紹

大數據賽道將聚焦智慧海洋建設、數字金融科技、醫療大數據分析、智慧交通、快遞大數據、城市管理大數據等方向,設置若干數據算法和方案徵集賽題,旨在匯聚政產學研用多方力量,探索數據共享開放和開發利用的新模式,加快推動大數據技術創新和產業應用。

2021數字中國創新大賽

智能醫療決策,病理“金數據”賦能醫學診斷

從臨床科研角度,病理文本是醫生科研的數據基礎,然而病理文本是一種涉及多概念、多關系、多屬性的文本數據,醫生在借助病理文本時存在難以檢索到關鍵信息、費時、費力等痛點,導致醫生的工作效率不高…

賽道背景

賽題介紹

賽道組織

參賽規則

賽題說明

數據說明

大賽提供三類數據集:
1、訓練集:未標注,1000份病例,需選手自行標注,選手應結合提供的10類實體定義、“標注參考數據集”樣例和相應的醫學臨床知識完成數據標注再開展模型訓練。
2、標注參考數據集:已標注,100例,由5人醫生團隊標注而成,低年資醫生分別標注,標注結果一致則通過,不一致由高年資醫生協同判斷,再進行脫敏、脫密形成的真實標注數據集。
3、測試集:未標注,1050例,選手用於預測提交,線上評分。測試數據提供txt文本,選手預測相應實體提交tag文件。禁止對測試數據手工標注。

共定義了10類實體,具體類別定義如下:【枚舉實體類型定義】

  • 1、腫瘤位置( B-Tloc ):指腫瘤所在的部位
  • 2、腫瘤組織學類型( B-This ): 指肝細胞癌的組織排列方式。
  • 3、分化程度( B-Tdiff ):腫瘤的分化是指腫瘤組織在形態和功能上與某種正常組織的相似之處,相似的程度稱為腫瘤的分化程度。
  • 4、腫瘤數量( B-Tnum ):指腫瘤的數目。
  • 5、腫瘤大小( B-Tsize ):指腫瘤的大小。
  • 6、微血管癌栓( B-MVI ):指在顯微鏡下於內皮細胞襯覆的脈管腔內見到癌細胞巢團,以門靜脈分支為主( 含包膜內血管 )。根據MVI的數量和分佈情況進行風險分級。
  • 7、衛星子灶( B-State ):指主瘤周邊近癌旁肝組織內出現的肉眼或顯微鏡下小癌灶。
  • 8、肝硬化程度( B-LC ):各種病因引起的肝髒疾病的終末期病變,病變以慢性進行性、彌漫性的肝細胞變性壞死、肝內纖維組織增生和肝細胞結節狀再生為基本病理特徵,廣泛增生的纖維組織分割原來的肝小葉並包繞成大小不等的假小葉,引起肝小葉結構及血管的破壞和改建。
  • 9、病理分期( B-TNM ):是美國癌症聯合委員會和國際抗癌聯盟建立的惡性腫瘤分期系統。T是指原發腫瘤、N為淋巴結、M為遠處轉移。
  • 10、包膜( B-Caps ):指包繞在腫瘤組織外層的纖維組織。

提供的標注文件示例:
標注文件tag每行包括起始位置、結束位置、實體類別以及實體內容。其中“起始位置”、“結束位置”、“實體類別”和“實體內容”間以“#”分隔。實體邊界位置,左開右閉。
例:
樣本:【1.( 右肝腫瘤 )①肝細胞癌伴壞死】
標註:【3#5#Tloc#右肝】

格式及樣本說明:
1、提供的原始數據文件都為txt格式
2、提供的標注參考文件為tag格式,選手需提交的結果文件為tag格式
3、每單個文件包含50例病例

提交要求

測試數據為txt文本,選手需要為每一個txt文本輸出對應的tag文本,utf-8編碼。答案文件每行包括起始位置、結束位置、實體類別以及實體內容。其中“起始位置”、“結束位置”、“實體類別”和“實體內容”間以“#”分隔。實體邊界位置,左開右閉。
最終tag文件存放目錄壓縮成zip格式進行提交,命名為results.zip。

提交示例

測試數據為txt文本,對應的tag文本( utf-8編碼 )如下:
0.tag
564#567#Tnum#4個
7407#7411#MVI#M1級
……
1.tag
12226#12232#This#梁索型
16821#16826#Tsize#0.7cm
……
tag文件存放results目錄下,壓縮為results.zip文件提交,如下所示:
results( 文件夾,壓縮後上傳 )
|—- 0.tag
|—- 1.tag
|—- 2.tag

賽程賽制

時間賽程階段
2021年1月17日賽道啟動發布
2021年2月20日報名通道開啟
2021年2月20日-4月7日線上A榜
2021年4月8日線上B榜
2021年4月9日-4月18日晉級團隊資格審核
2021年4月19日-4月20日線上決賽答辯
2021年4月25日-4月26日總決賽路演及系列活動

獎項激勵

獎項數量獎金( ¥ )
一等獎1100000
二等獎140000
三等獎110000
優勝獎25000

賽事評審

本任務採用嚴格F1-Measure作為評測指標,評測以Micro F1值作為最終排名依據。
記真實結果為S={s1,s2,……,sn},預測結果為G={g1,g2,……,gn}。我們採用嚴格的指標,當且僅當:
1、si.ID=gi.ID
2、si.Category=gi.Category
3、si.Pos_b=gi.Pos_b
4、si.Pos_e=gi.Pos_e

基於以上等價關系,我們定義集合S與G的嚴格交集為。由此得到嚴格評測指標:

參賽交流

大賽QQ交流群( 群名:智慧醫療賽題交流群 群ID:977092730 )

官方公眾號:一碗數據湯( 持續發布賽事相關信息 )


相關連結:


數字中國創新大賽相關競賽


You may also like...

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料