123,123

中國電信完成業(yè)界首個面向大模型推理的異構(gòu)算力協(xié)同技術(shù)驗證

翼研 2025-10-15 人民郵電報

近期，中國電信研究院聯(lián)合北京智源人工智能研究院、昆侖芯科技有限公司、中興通訊、北京基流科技有限公司、中科加禾公司等產(chǎn)業(yè)合作伙伴，依托中國電信云網(wǎng)融合大科創(chuàng)裝置，完成業(yè)界首次DeepSeek系列模型基于“英偉達(dá)算力+國產(chǎn)算力”交叉組合的異構(gòu)PD分離推理試驗驗證，實現(xiàn)大模型推理集群的降本增效。

本試驗完成了面向大模型推理的異構(gòu)算力協(xié)同技術(shù)針對6類典型場景的推理性能驗證，DeepSeek 671B模型在多種場景下實現(xiàn)推理集群總吞吐性能30％～72％的提升，并發(fā)能力提升2倍，同等吞吐條件下，異構(gòu)算力組合推理成本下降最高達(dá)42％，真正實現(xiàn)“存量利舊”與“國產(chǎn)替代”的雙重目標(biāo)。

針對推理Prefill與Decode階段特性優(yōu)化芯片設(shè)計逐漸成為行業(yè)共識，英偉達(dá)和華為分別發(fā)布芯片設(shè)計規(guī)劃，將PD兩階段分別適用“高算低存”和“低算高存”的思路融于芯片設(shè)計。中國電信研究院在2025年初洞察到PD分離推理對算力異質(zhì)性的需求，構(gòu)建異構(gòu)通信優(yōu)化、PD資源調(diào)配、推理任務(wù)調(diào)度全棧自研異構(gòu)混推體系，展現(xiàn)出三大核心優(yōu)勢：一是通過自研異構(gòu)傳輸引擎，實現(xiàn)跨架構(gòu)芯片PD池間KVCache的高效傳輸；二是采用自研國產(chǎn)算力賦能工具“翼芯”，根據(jù)業(yè)務(wù)特征與算力性能自動推薦并實時優(yōu)化PD資源配比；三是構(gòu)建AI推理平臺，實現(xiàn)推理任務(wù)在Prefill池與Decode池間的動態(tài)調(diào)度。

技術(shù)驗證的成功體現(xiàn)了中國電信對智算推理優(yōu)化技術(shù)的深刻理解與對國產(chǎn)算力適配調(diào)優(yōu)的實踐創(chuàng)新，彰顯了中國電信作為算力基礎(chǔ)設(shè)施建設(shè)方推動國產(chǎn)算力從“可用”到“好用”的央企擔(dān)當(dāng)。未來，中國電信將持續(xù)深化國產(chǎn)算力高質(zhì)量發(fā)展布局，面向大模型訓(xùn)推一體、多智能體系統(tǒng)打造“互聯(lián)互通、高效協(xié)同”的異構(gòu)算力生態(tài)格局，推動新型信息基礎(chǔ)設(shè)施協(xié)調(diào)發(fā)展。

掃一掃在手機(jī)打開當(dāng)前頁

關(guān)鍵詞?:算力;研究院

創(chuàng)新業(yè)務(wù)推薦

精彩專題

2025國際信息通信展

9月24日至26日，2025年中國國際信息通信展覽會于北京國家會議中心舉辦。中國電信以“智領(lǐng)華章惠啟未來”為主題參展，全面展現(xiàn)中國電信作為建設(shè)網(wǎng)絡(luò)強國、科技強...

高質(zhì)量發(fā)展看電信

中國電信助力各地經(jīng)濟(jì)高質(zhì)量發(fā)展，運用5G+AI等高科技技術(shù)手段幫助貴州、山東、湖南、陜西等地的企業(yè)和鄉(xiāng)村產(chǎn)業(yè)發(fā)展。中國電信用實際行動讓智能技術(shù)切實為人民群眾服務(wù)...