韦乐平详解生成式人工智能的联网技术

内容摘要飞象网讯(易欢) 4月23日消息,在今日举办的“2025云网智联大会”上,SNAI推委会荣誉主席、原中国电信科技委主任韦乐平表示,生成式人工智能的联网技术主要包括以太网、IB(InfiniBand)、芯片光互连、PCIe、CXL(计算机快速

飞象网讯(易欢) 4月23日消息,在今日举办的“2025云网智联大会”上,SNAI推委会荣誉主席、原中国电信科技委主任韦乐平表示,生成式人工智能的联网技术主要包括以太网、IB(InfiniBand)、芯片光互连、PCIe、CXL(计算机快速链路)、OCS(光纤交换)等。

其中,以太网是世界上规模最大的低成本联网技术,但是,其传统形态和协议已经不能满足大集群联网的苛刻性能需求。目前有三个改进方向:RoCE是一种基于以太网的RDMA。允许直接访问远程节点内存,减小了数据传递时延,降低了CPU的使用率。适合GenAI应用的需求;无损以太网在现有以太网基础上进一步采用先进的流控、改进拥塞处理、优化哈希算法等新技术,性能大为改进,但是长尾时延仍偏高(5-10us),赶不上IB(1us),适合不高于2000GPU互连场景;超级以太网联盟(UEC)从物理层、链路层、传输层和软件层全面改进以太网,具有优异的负荷均衡、更好的网络利用率和更短的时延,满足GenAI和HPC所需,同时保留以太网生态系统的优势,期望性价比全面赶超IB。预计2026年起量。

IB是一种用于高性能计算的计算机网络,具备高宽带、高扩展、高可靠、无阻塞、超低时延(1us)的特点。但其需要采用专用硬件IB交换机和IB网卡,成本较高,扩展性受限,产业生态较弱,过于封闭,由英伟达独家控制。最适用高性能计算和高质量大模型训练场景。

芯片光互连是利用CMOS工艺,将光波导、耦合器和谐振器直接刻蚀在硅基上,再利用先进的封装技术将分立的具有特定功能的芯片组(各种XPU) 集成进来,构成一个实用化的,结合SiP和Chiplet技术的光互连器。 芯片光互连具备改进了计算集群的扩展性(超100T)和带宽(扩大5- 10倍)。并且,具备极低功耗、降低时延(可达10倍)、 能效(4-8倍) 和物理尺寸的优势。但其技术还不成熟,标准缺失,预计最快2026年就有产品。

PCIe是一种计算机串行扩展总线技术。自从1992年以来, PCIe一直用于高速、低时延、高带宽场景,例如数据中心内的非易失内存快 线(MVMe) 和GPU与CPU的互连等场景。当前应用最广的是PCIe5.0,采用NRZ调制格式,具备34GT/S能力。2022年发布PCIe6.0,进一步采用PAM4调制格式和灵活电源管理,最大限度的降低了功耗,具备64GT/S能力,还扩展了传输距离、简化了系统设计、降低了时延、改善了信号完整性。但是迄今尚无实际商用产品问世。2025年计划发布PCIe7.0版本,期望进一步提升至128GT/S能力。 

CXL是一种架构在PCIe串行总线上的新接口协议和高速互连技术。CXL允许计算机系统内不同组件间进行快速、可靠的数据传输。CXL打破了CPU与内存间的捆绑关系,能够在维系CPU内存空间和设备内存一致性的前提下,实现更加灵活和高容量的内存池化架构。长期看,CXL将导致现有服务器架构的解构,将处理、内存和I/0分别纳入不同物理模块,使能资源的查询和共享,适应大集群的训练需要和高性能计算的需要。

OCS是一种以光纤通道为交换颗粒的大容量交换。近中期主要替代AIDC中的Spine层的电交换机。长期会进一步向外扩展。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1