《科創板日報》7月16日,提及內蒙古,人們總會想起“風吹草低見牛羊”的草原牧歌畫卷。但從內蒙古自治區首府呼和浩特中心城區向南行進20多公里,眼前不僅有青山綠水與遼闊草原,更矗立著一座加速新質生產力發展的新一代數智基礎設施。
作為云計算領域的國家隊,中國移動以大算力支撐大模型發展,統籌規劃了“N+X”智算中心布局。其中,中國移動呼和浩特數據中心(以下簡稱中心)的智算規模達6.7EFLOPS,是全球運營商最大的單體液冷智算中心,也是中國移動集團規模最大、技術最先進、保障最完備的中心節點。
日前,《科創板日報》記者在該數據中心進行了實地探訪,深入了解這座草原之上的智算基礎設施全貌。
全球運營商最大單體液冷智算中心
從內蒙古自治區首府呼和浩特中心城區向南行進20多公里,便到達了和林格爾新區,成片的數據中心在藍天白云下整齊排列。這里是國家“東數西算”工程八大樞紐、十大數據中心集群之一,也是國家大數據綜合試驗區的核心區。
其中,中國移動呼和浩特數據中心是全球運營商最大單體液冷智算中心,總占地面積1402畝。
剛踏入中心,撲面而來的未來感仿佛把人拉進了科幻電影。跟隨講解員,《科創板日報》記者沿走廊深入,抵達智算心臟——一排排機柜整齊地排列,上面閃爍著不同顏色的指示燈,宛若銀河傾瀉,維系著整座“數智宇宙”的澎湃算力。
據中國移動內蒙古公司政企客戶部副總經理王科峰向《科創板日報》記者介紹,呼和浩特數據中心2012年開工建設,2016年正式投入運營,數據中心肩負國家東數西算布局中“援京助東”的算力使命,既能滿足京津冀高實時性算力需求,也能為長三角等區域提供非實時算力支撐。
中國移動為此投入了巨量的資金支持——呼和浩特數據中心基礎設施總體投資約400億元,規模和業務承載能力均為中國移動數據中心之首。目前,園區總體規劃建筑面積約142萬㎡,已建成10棟數據機房、6棟配套用房,土地利用率約65%。
2023年以來,以ChatGPT為代表的大模型橫空出世,掀起了一股席卷全球的AI浪潮。而想要在AI浪潮中占據優勢,就必須擁有強勁的AI算力支撐。因此,數據中心,作為AI算力的核心基礎設施,成為行業重點建設的對象。
為了提高數據中心功效,減少散熱耗能,液冷技術已成為新建數據中心的必選項,王科峰表示,中心之所以采用液冷技術,是因為當單機柜功率超過20至25千瓦時,傳統風冷散熱易在局部形成熱點;采用液冷技術對芯片實施精準冷卻,可有效消除熱點,并支持在機柜內部署更多服務器。
此外,項目選址呼和浩特,源于此地得天獨厚的資源、氣候、地理優勢。
比如,綠色低碳早已是數據中心發展趨勢所向。此前國家出臺的《數據中心綠色低碳發展專項行動計劃》提到,到2025年底,全國數據中心平均電能利用效率(PUE)降至1.5以下。
而內蒙古新能源年發電量全國第一,風電裝機量全國第一,綠電使用成本全國最低。綠電比例高,是中國移動呼和浩特數據中心的顯著優勢。據了解,2024年園區PUE(數據中心總能耗/IT設備能耗)為1.23,運營收入16.3億元,電量6.55億度,電費近2.4億,電費每度0.365元(含稅),2024全年綠電占比69%。
此外,王科峰介紹,這里年平均氣溫7.7℃左右,天然環境就能給數據中心自然散熱,使得用電成本大幅降低。
本土化率達85%
芯片和算力全球競爭的大背景下,倒逼國內算力產業鏈加速自主化進程。
目前,中國移動已實現五類國產化智能算力芯片落地與實際應用,特別是在中國移動智算中心(呼和浩特),智算服務器整機、軟件主要由中國廠商提供,智算芯片也大量采用本土廠商產品。
那么,中心與哪些本土芯片廠商建立了深度合作?王科峰表示,在軟硬件設備方面,芯片國產化算力占比超85%,含五類本土芯片,包括天數智芯、華為昇騰、壁仞、昆侖芯等,現有訓練卡1.98萬張,推理卡也近萬張(NVIDIA顯卡30、40系列等)。
此外,園區現有算力11400P,90%的算力資源用于服務京津冀地區客戶,智算業務涵蓋訓練、推理全場景,可以提供包括異構算力、分布式存儲、網絡等IaaS基礎設施服務,以及基于九天大模型和第三方平臺賦能的AI開發框架和AI使能的PaaS服務,并構建了通用大模型和行業大模型的MaaS服務。
一個問題也隨之而來,如何突破生態壁壘,實現多元芯片的異構混訓(如“三芯混訓”)?
王科峰解釋,如果把多元算力比作一片星羅棋布的群島,過去每座“芯片島”都筑有高墻,彼此孤立,中國移動要做的,是讓不同島嶼之間架起高速航道,最終形成一片融合、流動的“算力海”。為此,一支跨芯片、跨架構的“混訓艦隊”正日夜試航:
在多元異構算力整合方面,中國移動持續攻堅“多芯片混訓”技術,打破 GPU、NPU、CPU 等不同算力豎井式生態隔離,實現多元芯片的統一算力池化。當前,“雙芯”混訓最優訓練效率已突破 90%;“三芯”混訓已完成首輪驗證,初步投入生產運行。
總體而言,中心智算業務體系以算為中心、網為根基、智為引擎,形成了以移動云、IT云、網絡云三大中心云,聯動12個盟市邊緣云,構建成多級立體泛在算力架構,并與200G/400G OTN全光底座的云專網、AI使能平臺深度融合,通過不斷提升算力規模和種類,構筑了云邊端立體泛在、多層次的智算體系。
算力賦能千行百業
算力筑基,創新加速。在呼和浩特數據中心,從政務到工業,從物流優化到能源研發,算力正深度賦能千行百業。
據了解,平臺中心已落地了中國移動九天大模型(2000億參數)、中國石油昆侖大模型(3000億參數)、百度文心千帆邊緣推理,并完成 10 個通用大模型、3000 億參數規模的訓練任務。以及云游戲、云渲染等智算應用,并已形成了面向個人、家庭、政企三大市場提供的包括AR、VR、娛樂、智能家居、大模型訓練推理、AI平臺等智算服務。
在定制化服務能力方面,針對私有化部署需求,中心可提供一體機等多種交付形態,確保模型能力快速落地。中心秉持“模型鍛造能力、推理變現價值”的理念,現已建成集團內規模最大的智能訓練中心,面向渲染、游戲、電競、智能搜索等行業提供推理服務。
目前,已有內蒙古省內外黨政、金融、互聯網等113家行業客戶入駐園區。依托“九天”已孵化政務、醫療、工業、能源、教育等 40 余款行業大模型。下一步將在此基礎上,持續推進行業模型的深度應用與場景拓展,實現“賦能千行百業”。
典型落地案例包括:在客服領域,赤峰市 12345 政務服務熱線已部署客服語言大模型;中國移動 10086 人工客服系統亦完成大模型升級并投入運營。在能源與礦山領域,礦山大模型已在能源行業實現規模化應用;
《科創板日報》記者注意到,字節、智譜、滴滴、阿里云、北京城建、瞳感科技等大型科技企業也入駐了中心。
針對多租戶模型高效訓練問題,中國移動首創容器彈性資源管理KOSMOS架構,實現租戶間安全隔離,確保多租戶環境下的數據隱私與操作獨立性,使國產萬卡算力資源分鐘級拉起,并確保AI任務內節點間的通信鏈路最優,從而大幅提升整體計算效率與資源利用率。
當前,作為數智時代生產力之源的算力,正定義著新的生產力形態和國家治理模式。有研究表明,計算力指數平均每提高1個百分點,數字經濟和國內生產總值(GDP)將分別增長3.3‰和1.8‰。
中心已經做好了宏偉的未來規劃,王科峰介紹,結合技術演進趨勢,預計訓練與推理的算力配比將演進至約 1:10。中心將以“中心+邊緣”協同的方式,通過推理持續向產業鏈下游輸出 AI 能力,全面支撐人工智能在垂直行業的規模化應用。
下一步,中心正按國家 “十萬卡級科技創新集群”要求,儲備基礎資源與配套設施,唯大規模組網方案尚存挑戰,年內落地進度尚待明確。