华为iMaster CCAE平台升级!新增三大核心能力支撑万卡训练/推理高可用,已落地60集群覆盖多行业
2025-09-20

华
华为鲲鹏
正面
查看报告
华为在全联接大会2025期间,其计算CCAE领域总裁鲁驰发表主题演讲,介绍运维平台iMaster CCAE的技术进展。该平台新增月度级故障模式库、源代码级运维大模型、超大规模集群管理三大核心能力,可支持训练、推理、高性能计算场景的集群管理,实现万卡训练作业可用度99%及百/千卡推理业务可靠性99.99%。目前已在60个集群部署应用,覆盖运营商、互联网、金融、教育等行业,并分享了在银行、运营商、互联网项目中的典型应用价值。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
