公告:聚站网(www.565865.com)专业分类目录平台,收录各行业优秀网站(违法站勿扰),快审仅需20元/站,永久收录!合作QQ:404959672

快速审核,网站广告合作请联系我们
  • 分类:131
  • 网站:21677
  • 文章:20584

3月17日下午消息,联想宣布旗下首款AMD AI大模型训练服务器联想问天WA7785a G3在单机部署671B(满血版) DeepSeek大模型时,可实现极限吞吐量6708token/s,将单台服务器运行大模型的性能推向了新高。

依托联想万全异构智算平台,联想通过访存优化、显存优化、PCIe 5.0全互联架构创新以及精选SGLang框架中性能最优算子等诸多创新方式,对大模型从预训练、后训练到推理的全流程进行持续优化,在单台部署DeepSeek 671B大模型的联想问天WA7785a G3上实测最高吞吐量达6708 token/s。

在模拟问题对话场景(上下文序列长度128/1K)时,最高可支持并发数158,TPOT 93毫秒, TTFT 2.01秒;而在模拟代码生成(上下文序列长度512/4K )时,并发数可达140,TPOT 100毫秒, TTFT 5.53秒。这一成绩意味着单台联想问天WA7785a G3可以支撑1500人规模企业的正常使用,是继联想问天WA7780 G3服务器单机部署满血版DeepSeek 大模型总吞吐量突破2500 token/s之后,单机部署该大模型推理性能的又一次突破。

联想方面称,此次突破是联想中国基础设施业务群、联想研究院ICI实验室和AMD联合设计、协同调优、共同实现的。此结果也并非最终结果, 联想与AMD 还在持续尝试深度调优新方法,实现更高调优突破。

责任编辑:郝欣煜

    关键词: 吞吐量 首款 单机 旗下
    精彩推荐

    时间:25/08/08

    新浪科技讯3月17日下午消息,联想宣布旗下首款AMDAI大模型训练服务器联...

    时间:25/08/07

    新浪科技讯3月17日下午消息,据美的集团副总裁兼美的集团CTO卫昶对新浪...

    时间:25/08/07

    Crusoe首席执行官ChaseLochmiller和EngineNo.1创始人ChristopherJame...

    时间:25/08/07

    3月17日,股市指数午后出现分化,沪指微涨,创指跌超0.5%。板块方面,环保概...

    文章分类
    快审网站推荐
    随机网站推荐
    小红书21/09/27

    ​小红书-最大的全球购物社区,带你找到国外的好东西!每天10点开抢全...

    凤凰财经21/10/13

    凤凰财经,全球华人新主流财经门户,第一时间为用户提供专业财经资讯与数...

    马可波罗网专业B2B电子商务平台,服务于中小企业的精准采购搜索、撮合...

    太平洋汽车网隶属于广州太平洋电脑信息咨询有限公司自2002年7月成立...

    沪江21/10/06

    沪江为用户提供优质的学习资讯以及教学平台,提供各种外国语种学习、考...

    这是免费的歌谱简谱交流平台。数万首热门歌曲,经典的歌谱简谱五线谱让...

    律师21/10/10

    律师365,国内最为专业的律师咨询网站:为寻求法律咨询及聘请律师的朋友...

    CCTV节目为你提供央视各个频道的节目预告、直播、点播等服务,可在线获...

    新浪网21/09/24

    新浪网为全球用户24小时提供全面及时的中文资讯,内容覆盖国内外突发新...

    广州市家庭医生在线信息有限公司2008年8月由中山大学广州中大控股有...