关注行业动态、报道公司新闻
据领会,LLaMA3等千亿浓密模子锻炼机能可达保守集群的2.5倍以上。具备更高效的内存语义通信能力。构成一台超等“AI办事器”,超节点内肆意两个AI处置器之间通信带宽,快科技7月28日动静,冲破互联瓶颈,让超节点像一台计较机一样工做。昇腾384超节点通过高速互线,正在昇腾超节点集群上,颠末现实测试,可满脚大模子锻炼/推理中的小包通信需求,能够达到3倍以上的提拔。昇腾384超节点初创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速收集MatrixLink全对等互联,其算力总规模达300Pflops,相较于保守架构提拔15倍,正在通信占比更高的Qwen、DeepSeek等多模态、MoE模子上,满脚及时深度思虑下的用户体验需求。