性爱av在线免费|成人主播免费国产|亚洲中文字幕自拍|亚洲成人社区免费|东京三区二区香蕉在线观看|久草 一区 日韩|日日日av日日日|天天干天天操人人操|亚洲精品中字无码国产原创剧传媒|亚洲春色AV无码专区在线播放

證券日報(bào)微信

證券日報(bào)微博

您所在的位置: 網(wǎng)站首頁 > 會議活動 > 正文

存力中國行暨先進(jìn)存力AI推理工作研討會在京順利召開

2025-11-07 15:02  來源:證券日報(bào)網(wǎng) 

    本報(bào)記者 許林艷

    11月4日,由中國信息通信研究院組織召開的“存力中國行暨先進(jìn)存力AI推理工作研討會”在北京順利召開。本次會議深入探討了AI時(shí)代下先進(jìn)存力賦能AI大模型發(fā)展的支撐作用。

    中國信息通信研究院首席專家石友康出席研討會并致辭,中國信息通信研究院云大所總工程師郭亮主持。中國移動云能力中心項(xiàng)目總師周宇,華為數(shù)據(jù)存儲產(chǎn)品線戰(zhàn)略與業(yè)務(wù)發(fā)展部總裁王旭東,北京硅基流動科技有限公司解決方案總監(jiān)唐安波發(fā)表主題演講。

    研討會上,中國信息通信研究院首席專家石友康深刻闡述了當(dāng)前AI規(guī)模化應(yīng)用推進(jìn),推理環(huán)節(jié)的成本、效率、質(zhì)量問題凸顯,先進(jìn)存力成為提升AI推理效能、控制成本的關(guān)鍵。當(dāng)前,國家高度重視先進(jìn)存力發(fā)展,在《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計(jì)劃》等政策中明確提出“加速存力技術(shù)研發(fā)應(yīng)用”“持續(xù)提升存儲產(chǎn)業(yè)能力”“推動存算網(wǎng)協(xié)同發(fā)展”,為產(chǎn)業(yè)發(fā)展指明了方向。中國信息通信研究院在政策研究、標(biāo)準(zhǔn)制定、測試服務(wù)等方面開展多項(xiàng)工作,并聯(lián)合產(chǎn)業(yè)鏈企業(yè)成立“算力產(chǎn)業(yè)發(fā)展方陣先進(jìn)存力AI推理工作組”,同時(shí)提出了三點(diǎn)建議:鼓勵前沿存儲技術(shù)研發(fā)創(chuàng)新,推動存算運(yùn)深度融合,加強(qiáng)存算協(xié)同產(chǎn)業(yè)生態(tài)建設(shè),呼吁業(yè)界同仁凝聚共識,共同推動我國存算協(xié)同發(fā)展。

    周宇分享了面向推理的存儲技術(shù)趨勢與實(shí)踐,圍繞推理挑戰(zhàn)、存儲破局及趨勢判斷展開。當(dāng)前推理面臨KV Cache存儲需求升級、多模態(tài)數(shù)據(jù)協(xié)同、存算協(xié)同帶寬不足、負(fù)載潮汐性及成本控制等挑戰(zhàn)。移動云針對性采用分層緩存調(diào)度、高速數(shù)據(jù)互聯(lián)技術(shù)提升帶寬、多模數(shù)據(jù)專屬存儲與標(biāo)準(zhǔn)化、架構(gòu)池化重組等技術(shù)破局,還通過高密全閃存儲、數(shù)據(jù)縮減、自研SPU高密服務(wù)器提高存儲效能和降低成本。未來趨勢上,移動云推動存儲從被動存儲轉(zhuǎn)向智算協(xié)同,分階段落地高密全閃存儲、數(shù)據(jù)高速互聯(lián)、存算一體等技術(shù),長遠(yuǎn)構(gòu)建池化多體存儲體系,同時(shí)強(qiáng)調(diào)技術(shù)整合與生態(tài)協(xié)同。

    王旭東介紹了AI時(shí)代,IT基礎(chǔ)設(shè)施能力面臨三大挑戰(zhàn):“管不好”的數(shù)據(jù)、“喂不飽”的算力、“降不下”的成本。推理數(shù)據(jù)來源多樣難以形成高質(zhì)量、可持續(xù)供應(yīng)的數(shù)據(jù)集,存儲系統(tǒng)的帶寬和IOPS(每秒讀寫次數(shù))不足,導(dǎo)致GPU等昂貴算力資源長時(shí)間空閑。傳統(tǒng)存儲架構(gòu)難以兼顧高吞吐、低時(shí)延及異構(gòu)數(shù)據(jù)融合的需求,造成業(yè)務(wù)發(fā)展瓶頸,阻礙AI應(yīng)用落地。華為針對AI推理研發(fā)的UCM推理記憶數(shù)據(jù)管理技術(shù)在行業(yè)落地中的核心作用,通過“集中高質(zhì)數(shù)據(jù)、提速AI訓(xùn)練、優(yōu)化推理效能”三個角度,打造AI推理加速解決方案。

    唐安波在會上圍繞大模型推理“推不動、推得慢、推得貴”問題展開分享,硅基流動構(gòu)建的AI infra工具鏈,聚焦提升算力利用率。核心推理框架適配100多款開源大模型,并通過公有云服務(wù)平臺為廣大開發(fā)者和企業(yè)提供優(yōu)質(zhì)的大模型服務(wù)。解決方案上,結(jié)合UCM技術(shù)卸載KVCache釋放顯存、提升推理性能,同時(shí)通過智能網(wǎng)關(guān)進(jìn)一步優(yōu)化流量調(diào)度、彈性擴(kuò)縮容等策略,來應(yīng)對高并發(fā)、低延時(shí)、高吞吐、長上下文等痛點(diǎn),基于存儲的KVCache方案可大幅提升系統(tǒng)吞吐。

    在內(nèi)部研討環(huán)節(jié),參會專家圍繞算力產(chǎn)業(yè)發(fā)展方陣先進(jìn)存力AI推理工作組下一階段工作建議進(jìn)行研討,中國移動云能力中心、華為、硅基流動、浪潮信息、清微智能、東方算芯、智元芯、算苗科技、得一微電子等工作組成員單位參與討論,貢獻(xiàn)實(shí)踐經(jīng)驗(yàn)。存力中國行暨先進(jìn)存力AI推理工作研討會的成功舉辦,為存力產(chǎn)業(yè)創(chuàng)新發(fā)展凝聚共識,指明方向。

(編輯 郭之宸)

-證券日報(bào)網(wǎng)
  • 24小時(shí)排行 一周排行

版權(quán)所有《證券日報(bào)》社有限責(zé)任公司

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455

京公網(wǎng)安備 11010602201377號京ICP備19002521號

證券日報(bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。

證券日報(bào)社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注