2020 AIIA 杯人工智能複雜網絡建模創新大賽.基站退服告警預測【中國移動】
賽制介紹
2020 AIIA杯人工智能複雜網絡建模創新大賽,暨ITU AI/ML in 5G挑戰賽中國賽區中國移動賽站,暨2020中國移動創客馬拉松大賽AI巡迴賽複雜網絡建模專題賽,相關組織方如下:
主辦方:國際電信聯盟(ITU)、中國人工智能產業發展聯盟(AIIA)、中國移動通信集團有限公司
協辦方:華為技術有限公司、英特爾(中國)有限公司
支持方:和鯨科技
本賽事包含網絡拓撲優化、基站退服告警預測兩個賽題,每支參賽隊伍只能報名其中一個賽題,每支隊伍最多不超過5名隊員。本賽題為基站退服告警預測。
報名時段:
2020-04-30 – 2020-06-30
一、背景介紹
現有網絡基站在運行的過程中出現故障時會產生告警,其中有一些屬於退服類告警,需要派發故障工單,由運維人員去基站處理故障。退服類告警產生說明基站已經發生退服,基站退服後用戶將無法連接到網絡,影響用戶正常通信。目前,4/5G基站的運維工作是被動的,只有在發生退服類告警之後才會派發故障工單。一般情況下,在退服類告警產生之前會有一些次要告警伴隨發生,因此可以搭建AI模型,通過次要告警來預測未來一段時間發生退服類告警的概率,對概率高的基站提前安排運維人員去處理故障,避免基站發生退服。
二、技術支持
中國移動九天人工智能平台是中國移動自主研發的首款人工智能平台,聚焦無線通信場景,從基礎平台、核心能力及典型應用產品三個層次提供豐富的AI服務。在基礎平台上,為從事AI研發的用戶提供GPU算力、主流AI開源框架和業界常見公開數據集。平台提供兩種使用模式:訓練模式和開發者模式。通過訓練模式,用戶可以通過web界面提交並運行基於TensorFlow、Caffe、Keras、Kaldi等框架設計的深度學習訓練任務,管理代碼、數據、模型,查看任務狀態及運行日誌;通過開發者模式,選擇web shell或者jupyter notebook任一工具為用戶提供更為靈活的訓練方式。平台上也部署了常用的公開訓練數據集,包括圖像的、人臉的、自然語言的和語音的,同時還放了豐富的案例,包括訓練案例和推理案例,比如MNIST手寫識別、圖像分類中的基於Inception、VGG、resnet這些主流模型的預訓練模型,以及調用AI能力平台語音轉寫、語言處理、圖像識別案例。詳情請鏈接:九天平台。
同時,華為昇騰將為本次賽事提供算力支持。詳情請鏈接:華為昇騰。
三、獎勵
本賽題將通過初賽,選出10支隊伍進入決賽,經過決賽路演和答辯,最終評出一等獎1名、二等獎2名、三等獎3名。獎勵金額為一等獎5萬元人民幣,二等獎2萬元人民幣,三等獎1萬元人民幣。
其他獎勵:
- 優秀項目有機會進入中國移動雙創平台進行孵化
- 優秀項目將晉級ITU AI/ML in 5G挑戰賽國際賽和中國移動創客馬拉松大賽決賽
- 獲得項目投資機會
- 中國移動優先合作機會,並向合作夥伴進行推薦
賽題說明
一、競賽任務
參賽者通過歷史告警數據來訓練AI模型。通過挖掘告警之間的相關性,從而利用次要告警預測未來一段時間內發生重要告警的概率,使運維人員能夠提前解決故障,避免網絡情況惡化。由於4/5G網絡運維模式相似,待5G網絡大規模商用後,該AI模型可以作為預訓練模型應用到5G網絡。訓練數據為某省市某廠家3-6個月的歷史故障告警。測試數據為同省市同廠家1星期的故障告警。均已做脫敏處理。評價標準為預測測試數據中全部基站未來24小時是否發生重要告警的F1-score。
二、數據
1.數據文件說明
a)訓練告警.csv
用於訓練模型的告警數據。為某省市某廠家3-6個月的歷史故障告警。
b)測試告警.csv
用於測試的告警數據。為同省市同廠家1星期的故障告警,需要預測未來24小時發生重要告警的概率。(如:給出2020/3/1 00:00:00-2020/3/7 23:59:59的告警,需要參賽選手預測2020/3/8 00:00:00-2020/3/8 23:59:59發生重要告警的概率)
2.告警數據包含字段(部分字段已脫敏編碼):
訓練告警數據每個基站一個csv文件,文件內容為該基站3-6個月的全部告警。測試告警數據每個基站一個csv文件,文件內容為該基站某星期的全部告警。
告警文件包括告警開始時間、告警標題、基站eNBID。
如下僅為參考樣例字段,實際告警詳單包括但不限於如下字段:
告警開始時間 | 告警標題 | 基站eNBID |
---|---|---|
2020-3-1 23:27:13 | 射頻單元IR接口異常告警 | 505894 |
2020-3-1 23:27:13 | 射頻單元交流掉電告警 | 505894 |
2020-3-1 23:27:13 | 射頻單元業務不可用告警 | 505894 |
2020-3-1 23:27:13 | 射頻單元駐波告警 | 505894 |
2020-3-1 23:27:13 | 網元連接中斷 | 505894 |
… | … | … |
3.訓練樣本說明:
參賽選手需自行從訓練告警數據中生成樣本,進行預測。規定如下:
重要告警為指定的幾類:網元連接中斷、eNodeB退服告警、小區不可用告警。
正樣本(標籤為1):
如取某樣本為24小時的告警數據(僅供說明,選手可自行生成樣本),該樣本未來24小時的告警數據包含重要告警中的任意一類或多類,則該樣本為正樣本。標籤為1。
舉例:該樣本取24小時的告警(2019/10/27 12:00:00-2019/10/28 11:59:59,紅框內),未來24小時(2019/10/28 12:00:00-2019/10/29 11:59:59,藍框內)有“網元連接中斷”這一重要告警,則該樣本為正樣本。
負樣本(標籤為0):
如取某樣本為24小時的告警數據(僅供說明,選手可自行生成樣本),該樣本未來24小時的告警數據不包含重要告警中的任意一類,則該樣本為負樣本。標籤為0。
舉例:該樣本取24小時的告警(2019/11/19 00:00:00-2019/11/19 23:59:59,紅框內),未來24小時(2019/11/20 00:00:00-2019/11/20 23:59:59,藍框內)沒有任何重要告警,則該樣本為負樣本。
三、測評方案
根據參賽選手提交的預測結果和實際發生退服類告警情況進行對比。
計算F1-score。
規則
- 所有參賽選手必須首先在本競賽網站上註冊和報名。報名完成後,將在24小時內通過郵件為參賽選手提供登錄中國移動競賽網站和九天人工智能平台的賬號和密碼。參賽隊伍需在中國移動競賽網站查看賽題和數據的詳細介紹、提交結果、查看排行榜,並在九天人工智能平台上開展數據使用、模型訓練、結果生成。
- 賽事組織機構單位中涉及題目編寫、數據接觸的人員禁止參賽。
- 參賽者對所有數據信息予以嚴格保密,在未得到主辦方事先許可的情況下不得披露給任何其他人士或機構。參賽選手如發表論文、公開演講等使用到比賽數據,需事先獲得主辦方許可,並不得對數據集或基於數據集的研究成果、產出物進行出售、轉讓或用於任何商業活動。
- 主辦方及協辦單位參賽,可參與排名,並發放證書,但不參與獎金分配。
- 參賽選手需確保註冊時提交信息準確有效,身份證、姓名信息提交審核後無法更改,所有的比賽資格及獎金支付均以提交信息為準。
- 每支參賽隊伍只能報名“複雜網絡建模專題賽”2個賽題“網絡拓撲優化”、“基站退服告警預測”中的一個,審核通過後不能更改。
- 每支隊伍需指定一名隊長,隊伍名稱不能超過15個字符,每支隊伍最多不超過5名隊員。
- 每名選手只能參加一支隊伍,參賽者有義務保證賬號信息的真實性和有效性,且賬號僅限於參賽者本人使用;參賽者禁止使用多賬號參賽,一旦發現某選手以註冊多個賬號的方式參加多支隊伍,將取消相關隊伍的參賽資格。同一參賽者不可使用多個賬號進行提交、刷分操作;如根據判斷認為參賽賬號存在異常或違背正常使用條例,主辦方可以單方面暫停或終止該賬號登錄大賽平台。
- 嚴禁參賽隊伍之間相互抄襲或抄襲他人作品。如不同參賽隊伍提交結果高度相似或與他人作品高度相似,經判定存在抄襲行為的,主辦方將取消相關參賽隊伍的參賽資格,相關參賽成績無效。另外,參賽者應保證其在比賽過程中所產出的所有成果未侵犯任何第三方的知識產權、商業秘密及其他合法權益。如第三方因為參賽者侵權行為提出索賠、訴訟等,參賽者應承擔由此產生的全部責任及損失,如導致主辦方等單位出現損失的,參賽者還應向其承擔賠償責任。
- 參賽選手禁止在指定考核技術能力的範圍外利用規則漏洞或技術漏洞等不良方式提高成績排名。參賽者若在參賽過程中發現相關規則漏洞或技術漏洞,有義務及時告知主辦方相關漏洞的信息,主辦方將對提供相關信息的參賽者表示相關感謝;若參賽者利用相關漏洞進行參賽,經判斷查證後,成績將會被判斷為無效成績。禁止人工標註、修改評測結果數據,禁止任何作弊手段,經發現將取消比賽成績並嚴肅處理。主辦方擁有作弊行為的判定權利和處置權利。
- 參賽隊伍可在參賽初賽期間隨時上傳測試集(或數據集)的預測(或優化)結果,由隊長賬號代表參賽隊的成果上傳,一天不超過1次,排行榜將在中午12點更新各個隊伍的最新排名情況。參賽者需要自行檢查提交文件的正確性,確認無誤後再進行提交,主辦方不負責對提交文件進行更改和調整。若因故出現數據更新、評審代碼更新、作弊檢查等原因主辦方有權對參賽結果進行重新測評並更新排行榜。
- 每個賽題初賽排名前10名的隊伍將進入決賽,進入決賽的參賽隊伍需要提交源代碼並配合主辦方進行代碼驗證,編輯語言推薦使用python,決賽隊伍需要進行路演和答辯。初賽成績佔總分的70%,決賽評審成績佔總分的30%。
- 主辦方保留修改作品的提交截止日期和路演日期的權利,主辦方有權在特殊條件下暫停或終止比賽或項目。若出現不可控因素,主辦方保留調整比賽各階段入選團隊數量的權利,以及調整獎項設置的權利。對影響比賽組織及比賽公平性的參賽團隊,主辦方保留收回或拒絕授予其獎項的權利。
- 參賽選手提交的成果不得侵犯他人知識產權。主辦方將為比賽提供數據集及算力工具,有權將該作品及相關資料用於宣傳、展覽等活動,主辦方對參賽隊在本次大賽中所提交的成果有優先排他使用權。
- 如入圍決賽的參賽隊伍對提交的成果需要對外開放軟件源代碼的,應事先徵得主辦方同意,除非所提交成果中所使用開源軟件的協議規定必須對外開放軟件源代碼。
- 參賽者同意、允許並保證配合主辦方為比賽而錄製和使用參賽者的音頻、視頻、圖片等,相關作品的版權歸主辦方所有。
- 參賽選手已仔細、認真、審慎閱讀本參賽須知以及大賽各項規則和通知要求,同意並接受其約束,並同意遵守由主辦方制定的各項規則和制度;尊重並接受大賽評委會做出的評判、大賽主辦方做出的決定等。
- 參賽選手保證其不會向任何主辦方或大賽其他合作方及其工作人員,提供或同意提供任何形式的酬勞以獲得其參與大賽的資格或大賽晉級、獲獎資格等,或做出其他賄賂主辦方及相關單位工作人員的行為;參賽選手保證其不會接受,或者同意接受任何形式的酬勞,並在大賽過程中為任何產品或服務做廣告推廣,或者使用有廣告推廣意圖的物品。
- 本須知的最終解釋權歸主辦方享有。