午夜福利在线观看 智谱发布Infra新后果:同等硬件干预,算力多出15%
发布日期:2026-06-06 14:29 点击次数:190

新浪科技讯 5月21日上昼音问,智谱本日告示落地部署了一项径直影响大模子推理遵循的架构更动ZCube:线上Infra实测数据标明,在同等GPU确立下,将汇注带宽从200Gbps提高至400Gbps,推理总隐隐提高约10%,首响时延下跌19%午夜福利在线观看,这一规定跟着推理界限扩大会越来越显贵。
通过将ZCube干预在千卡级GLM-5.1的一个线上推理集群中,在GPU型号、软件栈、业务代码一都不变的前提下,仅升级汇注架构,其与传统ROFT架构的对比GPU平均推理隐隐提高15%以上,TTFT P99尾时延下跌40.6%。
这意味着,相同的硬件干预下,无套进入内谢11P视频A片智谱GLM大模子当今每秒能多反映15%的API苦求。关于功绩上百万建设者的大模子API平台而言,这径直对应更高的并发上限、更低的列队延长,以及在流量峰值下更踏实的用户体验。
资本端的变化相同彰着,ZCube 架构所需的交换机和光模块比原有决议少三分之一。界限越大,这个差值越可不雅。
更裂缝的是,这项升级的旯旮资本接近于零:GPU 不换,功绩器不换,软件代码不改,爽气是组网架构的替换。这意味着智谱已有的算力财富在同等干预下开释了更高的产出,相配于存量财富的遵循重估。
据悉,ZCube时间被国外顶会ACM SIGCOMM 2025评价为“显贵变调悉数这个词行业对汇注的贯通格式”,这次在智谱的落地奉行是ZCube架构初度在信得过大界限推理集群中完成分娩考证。(文猛)
海量资讯、精确解读,尽在新浪财经APP
包袱裁剪:江钰涵 午夜福利在线观看

