昇腾大模型推理框架JittorInfer全面升级并开源,性能显著提升
2025-08-21

华
华为欧拉
弱中性
查看报告
清华大学计图团队对昇腾大模型推理框架JittorInfer进行全面升级并正式开源。该框架针对昇腾硬件进行了深度优化,引入算子融合下发和全链路服务端优化等关键技术,显著提升了DeepSeek系列大模型的推理性能。主要升级包括减少CPU与昇腾硬件交互开销、优化数据传输和调度机制、提升KV Cache效率等,使昇腾算力利用率最大化,降低延迟提升吞吐量。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
