轮值董事长徐直军最新演讲

发布日期:2025-11-19 10:57:26   来源 : 智合商学    作者 :智合咨询    浏览量 :3
智合咨询 智合商学 发布日期:2025-11-19 10:57:26  
3

以开创的超节点互联技术

引领AI基础设施新范式




华为轮值董事长徐直军在2025年华为全联接大会上的主题演讲全文如下:


女士们、先生们,各位老朋友、新朋友,大家上午好!

欢迎来参加2025年华为全联接大会,时隔一年,很高兴再次与大家相聚在上海。我想大家都能感受到,过去的一年对所有AI从业者、关注者来讲是记忆深刻的一年,DeepSeek横空出世,让全国人民过了一个快乐的AI春节、科技春节,也让所有大模型训练者开启了不知多少个不眠之夜,调整训练方式,复现DeepSeek结果。当然也给我们带来了巨大冲击,华为云为了接住DeepSeek快速增长的用户和流量,日夜奋战,AI研发团队从春节开始,到今年4月30日,经过多团队的协同作战,终于使Ascend 910B/910C的推理能力达成了客户的基本需求。

在进入今天的具体分享之前,请允许我回顾一下去年的HC,我讲到了如下几点:

第一、智能化的可持续,首先是算力的可持续;

第二、中国半导体制造工艺将在相当长时间处于落后状态;

第三、可持续的算力只能基于实际可获得的芯片制造工艺;

第四、人工智能成为主导性算力需求,促使计算系统正在发生结构性变化;

第五、开创计算架构,打造“超节点+集群”算力解决方案持续满足算力需求。

但第五点没有展开讲,今天,我想利用此机会,来把我去年HC没有完成的任务完成,也算是答卷。我今天分享的主题是:“以开创的超节点互联技术,引领AI基础设施新范式”,也是回答去年HC提到的第五点:如何开创计算架构,打造 “超节点+集群”算力解决方案来持续满足算力需求。

在展开今天主题前,回到DeepSeek对产业界、对华为的冲击,DeepSeek开源后,我们的客户对华为的昇腾发展指出了很多问题,也充满了期待,并一直在给我们不断地提建议。为此,经过内部的充分讨论并达成共识,我们于2025年8月5日在北京专门举办了昇腾产业峰会,我代表华为给出了回应,在座的有的参加了,有的可能没有参加。今天,我也利用此机会就主要的决定给大家汇报一下。主要有四点:

一、华为坚持昇腾硬件变现;

二、CANN 编译器和虚拟指令集接口开放,其它软件全开源,CANN基于Ascend 910B/C的开源开放将于2025年12月31日前完成,未来开源开放与产品上市同步;

三、Mind系列应用使能套件及工具链全面开源,并于2025年12月31日前完成;

四、openPangu基础大模型全面开源。

接下来回到今天的主题。尽管DeepSeek开创的模式可以大幅减少算力需求,但要走向AGI、要走向物理AI,我们认为,算力,过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。

算力的基础是芯片,昇腾芯片是华为AI算力战略的基础。自2018年发布Ascend 310芯片,2019年发布Ascend 910芯片,到2025年,Ascend 910C芯片随着Atlas 900超节点规模部署,为大家所熟悉。在过去几年,客户和伙伴们对昇腾芯片有很多诉求,对昇腾芯片也有很多期待。面向未来,华为的芯片路标是如何规划的?想必是大家普遍关心的话题,可能也是最关心的内容。

因此,今天,我就直入主题来介绍昇腾芯片及其路标。我很确定地告诉大家,昇腾芯片将持续演进,为中国乃至世界的AI算力构筑坚固根基。

未来3年,至2028年,我们在开发和规划了三个系列,分别是Ascend 950系列,包括两颗芯片:Ascend 950PR和Ascend 950DT,以及Ascend 960、Ascend 970系列,更多具体芯片还在规划中。下面我分别介绍快要推出的和已规划的4颗昇腾芯片。

我们正在开发、且即将推出的芯片叫Ascend 950系列。我首先介绍一下Ascend 950系列的芯片架构,Ascend 950 PR和Ascend 950 DT共用了Ascend 950 Die。与前一代昇腾芯片相比,Ascend 950 在以下几个方面实现了根本性提升。

第一,新增支持业界标准FP8/MXFP8/MXFP4等低数值精度数据格式,算力分别达到1P和2P,提升训练效率和推理吞吐。并特别支持华为自研的HiF8,在保持FP8的高效的同时,精度非常接近FP16。

第二,大幅度提升了向量算力。这主要通过三个方面实现:其一,提升向量算力占比;其二,采用创新的新同构设计,即支持 SIMD/SIMT 双编程模型,SIMD能够像流水线一样处理“大块”向量,而SIMT便于灵活处理“碎片化”数据;其三,把内存访问颗粒度从512字节减少到128字节,内存访问更精细,从而更好地支持了离散且不连续的内存访问。

第三,互联带宽相比Ascend 910C提升了2.5倍,达到2TB/s。

第四,结合推理不同阶段对于算力、内存、访存带宽及推荐、训练的需求不同,我们自研了两种HBM,分别是:HiBL 1.0和HiZQ 2.0。不同的自研HBM与Ascend 950 Die合封,分别构成芯片Ascend 950PR:面向Prefill和推荐场景,以及Ascend 950DT:面向Decode和训练场景。下面分别介绍。

首先是我们的第一颗芯片,Ascend 950PR,主要面向推理Prefill阶段和推荐业务场景。首先,我们发现,随着Agent的快速发展,输入上下文越来越长,首Token输出阶段占用计算资源越来越多。其次是在电子商务、内容平台、社交媒体等业务应用中,要求推荐算法具有更高的准确度和更低的时延,对计算能力的需求也越来越大。推理Prefill阶段和推荐算法都是计算密集型,对计算并行的能力要求高,但对内存访问带宽的需求相对低。通过分级内存解决方案,推理Prefill阶段和推荐算法对本地内存容量的需求相对也不高。Ascend 950PR 采用了华为自研的低成本HBM,HiBL 1.0,相比高性能、高价格的HBM3e/4e,能够大大降低推理Prefill阶段和推荐业务的投资。

这颗芯片将在2026年一季度推出,首先支持的产品形态是标卡和超节点服务器。

接下来这一颗是Ascend 950DT,相比Ascend 950PR,它更注重推理Decode阶段和训练场景。由于推理Decode阶段和训练对互联带宽和访存带宽要求高,我们开发了HiZQ 2.0,使内存容量达到144GB,内存访问带宽达到4TB/s。同时把互联带宽提升到了2TB/s。其次,支持了FP8/MXFP8/MXFP4/HiF8数据格式。

Ascend 950DT 将在2026年Q4推出。

第三颗是在规划中的芯片Ascend 960。它在算力、内存访问带宽、内存容量、互联端口数等各种规格上相比Ascend 950翻倍,大幅度提升训练、推理等场景的性能;同时还支持华为自研的HiF4数据格式。它是目前业界最优的4bit精度实现,能进一步提升推理吞吐,并且比业界FP4方案的推理精度更优。

Ascend 960将在2027年四季度推出。

最后一颗是在规划中的Ascend 970,这颗芯片的一些规格还在讨论中。总体方向是,在各项指标上大幅度升级,全面升级训练和推理性能。目前的初步考虑是,相比Ascend 960,Ascend 970的FP4算力、FP8算力、互联带宽要全面翻倍,内存访问带宽至少增加1.5倍。Ascend 970计划在2028年四季度推出。大家届时可以期待它的惊人表现。

这是刚才介绍的昇腾芯片的主要具体规格和路标,总体上,我们将以几乎一年一代算力翻倍的速度,同时围绕更易用,更多数据格式、更高带宽等方向持续演进,持续提升昇腾芯片的竞争力,持续满足中国乃至世界AI算力需求。



⦁⦁⦁

>> 长按二维码关注我们 <<

智合咨询


地址:
电话:
南京市秦淮区卡子门大街101号复地中心
扫一扫 关注公众号
云计算支持 反馈 枢纽云管理