AI如何推动网络基础设施的变革
前言:本文作者为西蒙资深数据中心专家Gary Bernstein,他深入探讨了人工智能的最新发展,并指出了IT 网络基础设施该如何应对这些新的需求。
人工智能技术的最新发展几乎没有一天不成为头条新闻。早在 2022 年 11 月,OpenAI 就推出了 ChatGPT 大型语言模型,2023 年 4 月,微软 Azure OpenAI 服务的 GPT-4 发布,而就在今年 5 月,谷歌推出了与之竞争的全新 Bard AI 聊天机器人。毫无疑问,人工智能拥有改变我们日常生活的巨大力量。从聊天机器人到人脸识别,再到自动驾驶和早期疾病诊断,人工智能的应用似乎永无止尽。
根据 Statista 的数据,2023 年全球人工智能市场价值将达到 1423 亿美元,其中金融、医疗保健和高科技/电信市场将率先采用人工智能。在最新的数据中心内,人工智能已被广泛用于监控数据中心资产、主动检测故障以及通过更好地管理PUE(能源利用效率)来提高能效。我们今天能够看到的是,不仅是那些超大型独角兽企业,许多大型企业公司也都在利用人工智能。
“InfiniBand”和“以太网”
如今,许多支持人工智能的网络都在使用 InfiniBand 技术。值得注意的是,以太网仍然是大多数数据中心普遍采用的全球标准,而 InfiniBand 仅占市场份额的一小部分,主要用于 HPC 网络。现在,InfiniBand 市场的领导者 Nvidia 与思科、Arista 和 Broadcom 等众多领先的以太网交换机和芯片制造商之间的竞争已经展开。博通公司最近推出了 "Jericho3-AI "StrataDNX™ 芯片,将使用以太网而不是 InfiniBand 来构建人工智能集群。无论采用哪种协议,InfiniBand 和以太网都有高带宽和低延迟的要求,都需要高质量和高性能的光纤布线解决方案。
对电力和带宽的需求激增
数据中心面临的两个主要挑战是设备的极端电力需求和相关的冷却要求以及过高的GPU (图形处理器)带宽需求。
带有运行人工智能应用的 GPU 的超级计算机(如 Nvidia 的 DGX 平台)耗电量巨大,并且需要多个高带宽连接。Nvidia 有 DGX A100、H100,并且刚在 2023 年 5 月的 Computex 大会上推出了 GH200。这些 GPU 平台需要为每个 6U 机箱提供6.5kW到 11kW以上的功率。如果将这些数据与以往数据中心满载机柜的整柜7-8kW平均功耗,以及15-20kW的最大功耗相比,你就会明白人工智能到底有多耗电。
在带宽方面,这些 GPU 超级计算机通常需要多达 8 x 100Gb/s (EDR) ,200Gb/s (HDR) 或400Gb/s(NDR)的连接。每个 GPU 提供 8 个连接,总带宽可达 8x200G。
Nvidia 首席执行官 Jensen Huang 最近在 datacenterfrontier.com 上表示,“生成式人工智能正在推动计算需求的指数级增长”,“你会看到一个 10 年过渡期的开始,基本上是回收或再利用世界上的数据中心,并将其构建为加速计算”。
IT基础设施如何应对?
极端的供电和冷却要求迫使数据中心管理者重新思考基础设施的设计并实施变革。这通常包括改变网络设计和更多地分散 GPU 超级计算机机柜,可能使用列末(EoR)拓扑结构,以更好地应对温度上升。这意味着交换机到 GPU的物理距离必须增加。为了延长交换机到 GPU 的连接,数据中心运营商可能需要使用更多的光纤布线,而不仅仅是传统的交换机到交换机之间的结构化光纤布线。由于连接距离较长,直连铜缆(DAC)可能不是一个好的选择,因为在这种速度下,这些线缆组件的最大连接距离被限制在 3 至 5 米。除了光纤布线外,有源光缆(AOC)也是一种可行的选择,因为与 DAC 相比,它们可以覆盖更长的距离。有源光缆的优点包括其功耗要比收发器(光模块)低得多,并且能改善延迟。西蒙提供的有源光缆可以以 0.5 米为单位递增,从而对线缆管理更为友好。
数据中心主干网的交换机到交换机连接需要并行光纤技术来支持不断增长的带宽需求。目前的许多并行光纤技术方案都采用 8 芯光纤与MPO/MTP 光纤连接器相连接。这些 Base-8 MPO/MTP 解决方案可采用多模或单模光纤,并能够轻松迁移到更高速度。企业数据中心在向 100Gb/s 和 400Gb/s 升级时应考虑使用 Base-8 MPO/MTP OM4 布线解决方案,而云数据中心在向 400Gb/s 和 800Gb/s 迁移时应选择 Base-8 MPO/MTP 单模布线解决方案。
市场上的创新光纤配线系统可以灵活地支持不同的光纤预端接模块,包括MTP- LC 的 Base-8 和 Base-12模块、MTP 直通模块和熔接模块。这些系统便于接入、易于升级并改进了光缆管理。
由于延迟在人工智能应用中变得非常重要,西蒙推荐使用超低损耗 (ULL) 性能和 MTP/APC 连接器的“支持人工智能”解决方案。在部署新短距离单模应用(在超过100米的距离上支持 100、200 和 400 Gb/s 速率)时,应考虑采用超低损耗光纤布线。超低损耗布线可支持人工智能应用所需的更为严格的插入损耗要求,从而提升整体网络性能。西蒙还建议使用 APC(斜面物理接触)光纤连接器,如 MTP/APC 连接器,APC除了常用于单模连接,还可以用于某些多模布线应用。APC(与 UPC 连接器相比)的端面几何形状经过斜面研磨处理,可提高反射率,从而改善光纤性能。
人工智能是一种颠覆性技术,它也有可能彻底改变我们的生活和工作方式。数据中心运营商需要为人工智能的需求做好准备,现在就应该开始规划。他们应该考虑能快速、轻松地迁移到更高数据传输速度的解决方案,同时考虑如何提高数据中心的能效。为人工智能需求做好准备的数据中心将处于有利地位,能够随着人工智能的发展和应用,充分拥抱人工智能带来的机遇。
查看更多数据中心解决方案相关信息,请点击这里
查看更多高速互连产品相关信息,请点击这里
查看更多光纤布线相关信息,请点击这里
关于西蒙
成立于1903年的西蒙公司,是行业的领导者,专门从事高品质、高性能的IT基础设施解决方案和服务的设计与制造,用于数据中心、局域网和智能建筑。公司拥有全球性的销售、技术和物流网络,涵盖世界150多个国家,提供最全面的铜缆和光缆布线系统、机柜、机架、线缆管理、数据中心配电系统,以及智能基础设施管理解决方案。西蒙拥有超过400多项结构化布线的有效专利,其西蒙实验室将大量资源投入到在研发和行业标准的发展,并强调公司对客户和行业的长期承诺。通过持续致力于减少废料和节约能源,西蒙公司的环境可持续性指标在业界是无与伦比的。
媒体询问
赵婷
中国区市场部经理
西蒙公司
86-21-53850303-5306
tina_zhao@siemon.com