本報訊(記者賈麗)近日,聯想集團有限公司(以下簡稱“聯想”)宣布基于聯想問天WA7780 G3服務器,在行業內首次實現單機部署DeepSeek-R1/V3 671B大模型,以低于行業公認1TB顯存(實際768GB)承載多并發用戶流暢體驗,可以滿足千人企業的使用需求,為行業樹立了企業級大模型部署新基準。
作為全球關注的焦點,眾多企業正準備在本地化部署DeepSeek大模型。然而,在落地實施過程中用戶普遍面臨以下關鍵決策難題:單機能否部署滿血版DeepSeek R1?如何確保高并發與吞吐量下的優質體驗?
聯想此次突破為企業提供科學選型指南。針對行業公認1TB顯存是千億參數大模型運行基線,聯想中國基礎設施業務群和研究院ICI實驗室組成的聯合攻關團隊通過專家并行優化、智能訪存架構升級等,大幅提升顯存利用率,實現性能的提升。
據了解,聯想問天WA7780 G3服務器在2月初已實現單機768GB GPU顯存條件下部署DeepSeek 671B R1和V3滿血模型,并能滿足中小企業的并發需求,通過聯想萬全異構智算平臺的訪存優化等技術優化手段,實現單機一個月內并發能力增長10倍。
業內認為,聯想技術突破將有效破除大模型落地瓶頸,顯著加速大模型在企業的落地進程。
聯想負責人表示,聯想中國基礎設施業務群與聯想研究院ICI實驗室將繼續合作,依托雙方聯合打造的聯想萬全異構智算平臺對DeepSeek平臺從AI預訓練、后訓練到推理的全流程進行持續優化,加速大模型的落地。
(編輯 張明富)
10:13 | 上市公司年報披露收官:近五成公司... |
23:23 | 2024年度深市上市公司業績穩中有進... |
22:27 | 以點帶面 穩鏈強鏈 2024年度科創... |
22:26 | 出口含“新”量更足!滬市主板公司... |
22:23 | 證監會公布《證券期貨業統計指標標... |
21:59 | 基礎穩、韌性強 滬市主板公司2024... |
21:52 | 澄天偉業:第五屆監事會第三次會議... |
21:52 | 錦波生物:第四屆董事會第十次會議... |
21:52 | 中遠通:第三屆董事會第三次會議決... |
21:52 | 迪森股份:第九屆董事會第一次會議... |
21:52 | 天力鋰能:第四屆監事會第十次會議... |
21:52 | 正川股份:2024年年度股東大會決議... |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注