聯(lián)想發(fā)布萬(wàn)全異構(gòu)智算平臺(tái)4.0 訓(xùn)練時(shí)間最高可縮短50%
12月8日消息,聯(lián)想聯(lián)想于北京成功舉辦“異構(gòu)智算 本地引擎”2025產(chǎn)業(yè)聯(lián)盟高峰論壇暨AI算力基礎(chǔ)設(shè)施新品發(fā)布會(huì)。發(fā)布
會(huì)上正式推出“聯(lián)想AI工廠”解決方案,異構(gòu)助力企業(yè)數(shù)據(jù)中心實(shí)現(xiàn)從傳統(tǒng)算力中心向智能化AI工廠的智算最高全面轉(zhuǎn)型。
此次發(fā)布會(huì)同步推出多款新品,平臺(tái)包括基于英特爾至強(qiáng)6處理器的訓(xùn)練新一代高端大模型訓(xùn)練AI服務(wù)器——聯(lián)想問(wèn)天WA8080a G5,以及全新升級(jí)的時(shí)間聯(lián)想萬(wàn)全異構(gòu)智算平臺(tái)4.0。
該平臺(tái)在大模型預(yù)訓(xùn)練、可縮后訓(xùn)練、聯(lián)想推理及超智融合計(jì)算四大場(chǎng)景均實(shí)現(xiàn)性能突破,發(fā)布部分訓(xùn)練場(chǎng)景中訓(xùn)練時(shí)間最高可縮短50%。異構(gòu)
在異構(gòu)算力調(diào)度與一體化方面,智算最高聯(lián)想智能算力平臺(tái)已實(shí)現(xiàn)對(duì)計(jì)算資源的平臺(tái)統(tǒng)一抽象與高效調(diào)度,成功驗(yàn)證訓(xùn)練與推理任務(wù)的訓(xùn)練資源共享與無(wú)縫流轉(zhuǎn)能力。
通信網(wǎng)絡(luò)優(yōu)化方面,時(shí)間通過(guò)集成先進(jìn)在網(wǎng)計(jì)算技術(shù)與自研RoCE網(wǎng)絡(luò)自動(dòng)化調(diào)優(yōu)系統(tǒng),平臺(tái)不僅滿足了對(duì)無(wú)損網(wǎng)絡(luò)與通信性能的嚴(yán)苛要求,更實(shí)現(xiàn)了高性能網(wǎng)絡(luò)的“開(kāi)箱即用”。
針對(duì)高性能推理場(chǎng)景,聯(lián)想依托自研推理引擎,成功部署并驗(yàn)證了PD分離架構(gòu)與KV-Cache優(yōu)化技術(shù),在復(fù)雜模型上實(shí)現(xiàn)了吞吐量與響應(yīng)時(shí)間的顯著提升,完全符合服務(wù)等級(jí)協(xié)議(SLA)保障標(biāo)準(zhǔn)。
此次相關(guān)標(biāo)準(zhǔn)的制定與驗(yàn)證成果的發(fā)布,為高性能訓(xùn)練與推理所需的算力服務(wù)質(zhì)量確立了統(tǒng)一衡量基準(zhǔn),有助于推動(dòng)行業(yè)規(guī)范性能指標(biāo)與服務(wù)品質(zhì),引導(dǎo)算力基礎(chǔ)設(shè)施與服務(wù)商向體系化、高性能、高可靠方向持續(xù)發(fā)展,進(jìn)而加速整體產(chǎn)業(yè)升級(jí)進(jìn)程。
本文地址:http://m.zj28.net/html/6e7399920.html
版權(quán)聲明
本文僅代表作者觀點(diǎn),不代表本站立場(chǎng)。
本文系作者授權(quán)發(fā)表,未經(jīng)許可,不得轉(zhuǎn)載。