新品发布|华为CloudMatrix384,做适合大模型应用的算力服务
发布时间:2025-06-26

华为云CloudMatrix 384超节点具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大领先技术优势,以系统架构创新重新定义新一代AI基础设施。

6月20日,华为开发者大会2025(HDC2025)在东莞隆重举行。在主题演讲中,华为正式宣布CloudMatrix384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供澎湃算力。

随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。

新一代昇腾AI算力CloudMatrix384,支持最大规模384卡高速总线互联,训练推理性能大幅度提升。纵向扩展:通过高速网络交换机组成384卡超节点;横向扩展:参数面交换机最大支持16万卡集群规模。

对于万亿、十万亿参数的大模型训练任务,在云数据中心,还能将432个超节点级联成最高16万卡的超大集群;同时,超节点还可以支持训推算力一体部署,如“日推夜训”,训推算力可灵活分配,帮助客户优化资源使用。

全新超节点架构算力底座

最大支持16万卡集群,用高速总线互联替代传统传统以太,通信带宽提高15倍,通信带宽提升15倍,通信时延降低10倍。

AI数据加速更快

支持EMS服务,跨节点共享KV缓存,大幅降低首Token时延。支持SFS Turbo服务,实现AI数据加载速度提升10倍。

大规模集群性能更高

超节点+大规模专家并行的技术,支持单卡性能提升近4倍,支持一卡一专家分布式推理部署,相较于非超节点推理性能提升4X。

资源利用率提升

支持朝退夜训,通过训推共池,训练资源池和推理资源池,资源灵活调度,实现资源利用提升30%。

当前,昇腾AI云服务已经成为AI基础设施的优选,为超过1300家客户提供澎湃的AI算力,加速千行万业智能化升级。

注:本文素材来自华为官网,版权归作者所有