2020 AIIA 杯人工智能複雜網絡建模創新大賽.網絡拓撲優化【中國移動】

2020 AIIA 杯人工智能複雜網絡建模創新大賽.網絡拓撲優化【中國移動】

 總獎金: 120000(CNY)

最高獎金: 50000(CNY)

報名時間: 2020-04-30 ~ 2020-06-30

主辦單位: 國際電信聯盟(ITU)中國人工智能產業發展聯盟(AIIA)中國移動通信集團有限公司

主辦單位電話: +86-13521850718

主辦單位Email:dongxiaofei@caict.ac.cn

賽制介紹

2020 AIIA杯人工智能複雜網絡建模創新大賽,暨ITU AI/ML in 5G挑戰賽中國賽區中國移動賽站,暨2020中國移動創客馬拉松大賽AI巡迴賽複雜網絡建模專題賽,相關組織方如下:

主辦方:國際電信聯盟(ITU)、中國人工智能產業發展聯盟(AIIA)、中國移動通信集團有限公司
協辦方:華為技術有限公司、英特爾(中國)有限公司
支持方:和鯨科技

本賽事包含網絡拓撲優化、基站退服告警預測兩個賽題,每支參賽隊伍只能報名其中一個賽題,每支隊伍最多不超過5名隊員。本賽題為網絡拓撲優化。

報名時段: 2020-04-30 – 2020-06-30

一、背景介紹

4G網絡技術發展以來,互聯網技術得到了新的突破。各種網絡服務越來越多的融入了人們的生活,並且在人們的衣食住行各方面提供了很多的便利。5G時代對網絡鏈路的容量保障提出了更高的要求,然而在業務大力發展下,日益增長的流量造成的設備擴容需求與不平衡不充分的容量利用率之間,存在著矛盾。現有的網絡拓撲在規劃時,未充分考慮預測到流量未來的增長趨勢,面臨鏈路容量利用率不均衡的主要問題。因此,我們需要對現有網絡拓撲結構進行優化,通過對負載不均衡鏈路上的節點進行連接關係重組,來實現網絡全局精細化拓撲優化,推進降低人力物力成本,增加容量利用效能。

二、技術支持

中國移動九天人工智能平台是中國移動自主研發的首款人工智能平台,聚焦無線通信場景,從基礎平台、核心能力及典型應用產品三個層次提供豐富的AI服務。在基礎平台上,為從事AI研發的用戶提供GPU算力、主流AI開源框架和業界常見公開數據集。平台提供兩種使用模式:訓練模式和開發者模式。通過訓練模式,用戶可以通過web界面提交並運行基於TensorFlow、Caffe、Keras、Kaldi等框架設計的深度學習訓練任務,管理代碼、數據、模型,查看任務狀態及運行日誌;通過開發者模式,選擇web shell或者jupyter notebook任一工具為用戶提供更為靈活的訓練方式。平台上也部署了常用的公開訓練數據集,包括圖像的、人臉的、自然語言的和語音的,同時還放了豐富的案例,包括訓練案例和推理案例,比如MNIST手寫識別、圖像分類中的基於Inception、VGG、resnet這些主流模型的預訓練模型,以及調用AI能力平台語音轉寫、語言處理、圖像識別案例。詳情請鏈接:九天平台
同時,華為昇騰將為本次賽事提供算力支持。詳情請鏈接:華為昇騰

三、獎勵

本賽題將通過初賽,選出10支隊伍進入決賽,經過決賽路演和答辯,最終評出一等獎1名、二等獎2名、三等獎3名。獎勵金額為一等獎5萬元人民幣,二等獎2萬元人民幣,三等獎1萬元人民幣。

其他獎勵:

•優秀項目有機會進入中國移動雙創平台進行孵化
•優秀項目將晉級ITU AI/ML in 5G挑戰賽國際賽和中國移動創客馬拉松大賽決賽
•獲得項目投資機會
•中國移動優先合作機會,並向合作夥伴進行推薦

賽題說明

一、競賽任務

針對現有網絡拓撲負載不均衡的情況,對網絡拓撲結構在現有基礎上根據節點流量變化進行動態優化,通過對部分節點連接關係的拆除和有條件增加新的節點連接關係,優化拓撲結構,使得優化後的拓撲結構在現有節點流量未來變化基礎上,滿足負載均衡的相關條件。提供的數據包含城市A、城市B和城市C的網絡拓撲連接關係數據和網元屬性數據,網元屬性數據中包括2020年20天(3月30日至4月18日)小時級的網元節點流量數據。選手需首先對城市A、城市B和城市C的未來10天(4月19日至4月28日)小時級的網元節點流量進行預測,並根據流量預測結果,對三個城市未來10天的網絡拓撲結構進行動態優化,評價標準為計算3個城市未來10天(4月19日至4月28日)在真實網元節點流量下的網絡拓撲負載均衡E值和鏈路帶寬利用率優化到目標範圍內的鏈路數目比例等。

二、數據

提供的數據包含城市A、城市B和城市C的網絡拓撲連接關係數據和網元屬性數據,網元屬性數據中包括2020年20天(3月30日至4月18日)小時級的網元節點流量數據。因此,每個城市有1份網絡拓撲連接關係數據文件,20份網元屬性數據文件(3月30日至4月18日共20天,每天1份)。
網絡拓撲連接關係數據和網元屬性數據的字段如下:

1.Data_topology_cityname.csv,如,城市A的網絡拓撲連接關係數據,則命名為Data_topology_A.csv;

網絡拓撲連接關係數據字段描述如下:

序號 列名 中文名稱 解釋說明 字段類型
1 NodeID_A 網元A編號 網元A唯一標識號 str
2 longitude_A 網元A經度 網元A的經度位置坐標,如有缺失值,可不改動連接關係 float
3 latitude_A 網元A緯度 網元A的緯度位置坐標,如有缺失值,可不改動連接關係 float
4 type_A 網元A類型 網元A類型,分為:G\H\J str
5 NodeID_B 網元B編號 網元B唯一標識號 str
6 longitude_B 網元B經度 網元B的經度位置坐標 float
7 latitude_B 網元B緯度 網元B的緯度位置坐標 float
8 type_B 網元B類型 網元B類型,G\H\J str
9 A NE拓撲連接容量 網元拓撲連接的容量值 float
10 NE NE拓撲連接編號 網元拓撲連接的編號 str

網元連接關係樣例數據如下:

NodeID_A longitude_A latitude_A type_A NodeID_B longitude_B latitude_B type_B A NE
15286460 117.1403584 27.66914863 J 17796422 117.141392 27.66813433 J 10 176704142
45093217 117.1489742 27.67571647 J 53588738 117.148838 27.67227557 J 10 151339239
1589609 117.1422373 27.67183507 G 1847191 117.1396658 27.67420274 J 1 85235289
45093217 117.1489742 27.67571647 J 58796576 缺失值 缺失值 J 1 161488899

2.Data_attributes_cityname_day.csv,如,2020年3月30日城市A的網元屬性數據,則命名為Data_attributes_A_20200330.csv;

網元屬性數據字段描述如下:

序號 列名 中文名稱 解釋說明 字段類型
1 NodeID 網元A編號 網元的唯一標識號 str
2 type 網元A類型 網元類型,分為:G\H\J str
3 A 網元A容量 網元A容量值,單位G(即Gbit) float
4 longitude 網元A經度 網元A的經度位置坐標 float
5 latitude 網元A緯度 網元A的緯度位置坐標 float
6 D 敏感站點標識 標識該網元是否為敏感站點,是敏感站點為1,不是為0 int
7 fx_val0 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
8 fx_val1 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
9 fx_val2 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
10 fx_val3 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
11 fx_val4 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
12 fx_val5 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
13 fx_val6 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
14 fx_val7 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
15 fx_val8 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
16 fx_val9 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
17 fx_val10 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
18 fx_val11 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
19 fx_val12 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
20 fx_val13 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
21 fx_val14 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
22 fx_val15 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
23 fx_val16 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
24 fx_val17 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
25 fx_val18 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
26 fx_val19 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
27 fx_val20 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
28 fx_val21 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
29 fx_val22 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float
30 fx_val23 0~23H每時段網元流量均值 0~23H,每小時網元流量均值,單位M,和網元容量A的單位換算關係為:M*1024=1G。缺失值可用常見方法填充。 float

網元屬性樣例數據如下:

NodeID type A longitude latitude D fx_val0(後23列數據與此列類似,不全列出)
1590587 G 1 117.1422373 27.67183507 0 2488.51
1847191 J 1 117.1396658 27.67420274 0 4.56
43365083 J 1 117.1469591 27.67889268 0 0.04
78665085 J 1 117.1373822 27.66159354 0 缺失值

以上數據均已做脫敏處理。

三、測評方案

選手需首先對城市A、城市B和城市C的未來10天(4月19日至4月28日)小時級的網元節點流量進行預測,並根據流量預測結果,對三個城市未來10天(4月19日至4月28日)每天的網絡拓撲結構進行動態優化。

評測算法將根據參賽者提交的三個城市未來10天(4月19日至4月28日)的網絡拓撲動態優化結果數據進行負載均衡值計算,計算這3個城市在這10天真實網元節點流量(該數據不提供給參賽者)下的動態網絡拓撲負載均衡E值和鏈路帶寬利用率優化到目標範圍內鏈路數目比例的每小時日均值、日最小值和日最大值,最後對多日優化結果綜合考慮,計算最終評價指標。其中,負載均衡E值越小,鏈路帶寬利用率優化到目標範圍內的鏈路數目比例越大,則算法優化結果越好。負載均衡E值是網絡拓撲中所有鏈路fp值的方差。

拓撲優化結果(單日)綜合評價指標如下:

其中:

評價指標具體算法如下:
鏈路帶寬利用率目標範圍區間:

負載均衡E值計算方式如下:

其中:

術語定義如下:

•鏈路定義:首尾節點為G/H類節點,首尾節點A值相同;中間節點為J類節點,中間節點主鏈路上A值相同,副鏈路上節點或下掛點A值小於等於主鏈路A值;鏈路節點一般不多於15個。
•主鏈路定義:首尾節點為G/H類節點,首尾節點A值相同;中間節點為J類節點,中間節點A值相同。
•副鏈路定義:首尾節點為G/H/J類節點(首尾不同時為G/H類節點),首尾節點A值相同;中間節點為J類節點,中間節點A值小於等於首尾節點A值。
•下掛點定義:僅與某一個G/H/J類節點,單條邊連接的節點;下掛點A值小於等於被下掛點A值。
•相交情況下主鏈路與副鏈路區分:1、中間節點A值都相同的為主鏈路,否則為副鏈路;2、如果相交兩條鏈路中間節點A值都相同,網元數目少的為副鏈路;3、如果前兩個條件都無法區分,則隨機選一條為副鏈路。
註:一條鏈路上節點包括三種結構上節點的總和,分別是:該鏈路上主鏈路、以主鏈路上節點為首尾節點產生的副鏈路,和主/副鏈路上的下掛點。

拓撲連接拆除和增加條件:

1.拓撲連接拆除沒有條件,滿足最後優化後圖結構為符合條件的全連通圖即可;
2.拓撲連接增加條件:兩個網元間距離滿足小於等於d,則該兩個網元之間可增加邊。(d暫定為500米,後續可能會添加其他新增連接邊的限制條件)。

優化後的圖應滿足:

1.優化後的圖是全連通圖;
2.優化後圖中所有節點均在鏈路中;
3.優化後圖中每個J類節點,僅存在於一條鏈路中;G/H類節點可在多條鏈路中重複出現;
4.優化後圖中的鏈路上所有節點數目應在4-15之間,鏈路不宜過分短或長;
5.優化後圖中的下掛點結構應儘可能少。

優化算法/模型滿足運行條件:

硬件條件:8核256G內存,無GPU。
時間性能:對於20000個節點的圖,優化收斂的時間小於20min。

規則

1.所有參賽選手必須首先在本競賽網站上註冊和報名。報名完成後,將在24小時內通過郵件為參賽選手提供登錄中國移動競賽網站和九天人工智能平台的賬號和密碼。參賽隊伍需在中國移動競賽網站查看賽題和數據的詳細介紹、提交結果、查看排行榜,並在九天人工智能平台上開展數據使用、模型訓練、結果生成。
2.賽事組織機構單位中涉及題目編寫、數據接觸的人員禁止參賽。
3.參賽者對所有數據信息予以嚴格保密,在未得到主辦方事先許可的情況下不得披露給任何其他人士或機構。參賽選手如發表論文、公開演講等使用到比賽數據,需事先獲得主辦方許可,並不得對數據集或基於數據集的研究成果、產出物進行出售、轉讓或用於任何商業活動。
4.主辦方及協辦單位參賽,可參與排名,並發放證書,但不參與獎金分配。
5.參賽選手需確保註冊時提交信息準確有效,身份證、姓名信息提交審核後無法更改,所有的比賽資格及獎金支付均以提交信息為準。
6.每支參賽隊伍只能報名“複雜網絡建模專題賽”2個賽題“網絡拓撲優化”、“基站退服告警預測”中的一個,審核通過後不能更改。
7.每支隊伍需指定一名隊長,隊伍名稱不能超過15個字符,每支隊伍最多不超過5名隊員。
8.每名選手只能參加一支隊伍,參賽者有義務保證賬號信息的真實性和有效性,且賬號僅限於參賽者本人使用;參賽者禁止使用多賬號參賽,一旦發現某選手以註冊多個賬號的方式參加多支隊伍,將取消相關隊伍的參賽資格。同一參賽者不可使用多個賬號進行提交、刷分操作;如根據判斷認為參賽賬號存在異常或違背正常使用條例,主辦方可以單方面暫停或終止該賬號登錄大賽平台。
9.嚴禁參賽隊伍之間相互抄襲或抄襲他人作品。如不同參賽隊伍提交結果高度相似或與他人作品高度相似,經判定存在抄襲行為的,主辦方將取消相關參賽隊伍的參賽資格,相關參賽成績無效。另外,參賽者應保證其在比賽過程中所產出的所有成果未侵犯任何第三方的知識產權、商業秘密及其他合法權益。如第三方因為參賽者侵權行為提出索賠、訴訟等,參賽者應承擔由此產生的全部責任及損失,如導致主辦方等單位出現損失的,參賽者還應向其承擔賠償責任。
10.參賽選手禁止在指定考核技術能力的範圍外利用規則漏洞或技術漏洞等不良方式提高成績排名。參賽者若在參賽過程中發現相關規則漏洞或技術漏洞,有義務及時告知主辦方相關漏洞的信息,主辦方將對提供相關信息的參賽者表示相關感謝;若參賽者利用相關漏洞進行參賽,經判斷查證後,成績將會被判斷為無效成績。禁止人工標註、修改評測結果數據,禁止任何作弊手段,經發現將取消比賽成績並嚴肅處理。主辦方擁有作弊行為的判定權利和處置權利。
11.參賽隊伍可在參賽初賽期間隨時上傳測試集(或數據集)的預測(或優化)結果,由隊長賬號代表參賽隊的成果上傳,一天不超過1次,排行榜將在中午12點更新各個隊伍的最新排名情況。參賽者需要自行檢查提交文件的正確性,確認無誤後再進行提交,主辦方不負責對提交文件進行更改和調整。若因故出現數據更新、評審代碼更新、作弊檢查等原因主辦方有權對參賽結果進行重新測評並更新排行榜。
12.每個賽題初賽排名前10名的隊伍將進入決賽,進入決賽的參賽隊伍需要提交源代碼並配合主辦方進行代碼驗證,編輯語言推薦使用python,決賽隊伍需要進行路演和答辯。初賽成績佔總分的70%,決賽評審成績佔總分的30%。
13.主辦方保留修改作品的提交截止日期和路演日期的權利,主辦方有權在特殊條件下暫停或終止比賽或項目。若出現不可控因素,主辦方保留調整比賽各階段入選團隊數量的權利,以及調整獎項設置的權利。對影響比賽組織及比賽公平性的參賽團隊,主辦方保留收回或拒絕授予其獎項的權利。
14.參賽選手提交的成果不得侵犯他人知識產權。主辦方將為比賽提供數據集及算力工具,有權將該作品及相關資料用於宣傳、展覽等活動,主辦方對參賽隊在本次大賽中所提交的成果有優先排他使用權。
15.如入圍決賽的參賽隊伍對提交的成果需要對外開放軟件源代碼的,應事先徵得主辦方同意,除非所提交成果中所使用開源軟件的協議規定必須對外開放軟件源代碼。
16.參賽者同意、允許並保證配合主辦方為比賽而錄製和使用參賽者的音頻、視頻、圖片等,相關作品的版權歸主辦方所有。
17.參賽選手已仔細、認真、審慎閱讀本參賽須知以及大賽各項規則和通知要求,同意並接受其約束,並同意遵守由主辦方制定的各項規則和制度;尊重並接受大賽評委會做出的評判、大賽主辦方做出的決定等。
18.參賽選手保證其不會向任何主辦方或大賽其他合作方及其工作人員,提供或同意提供任何形式的酬勞以獲得其參與大賽的資格或大賽晉級、獲獎資格等,或做出其他賄賂主辦方及相關單位工作人員的行為;參賽選手保證其不會接受,或者同意接受任何形式的酬勞,並在大賽過程中為任何產品或服務做廣告推廣,或者使用有廣告推廣意圖的物品。
19.本須知的最終解釋權歸主辦方享有。


相關連結:

You may also like...

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料