
民信配资端
在现代人工智能 (AI) 和超大规模数据中心的架构中,数据传输的挑战日益严峻。尤其是在速度、距离和功耗这三个核心物理限制上。而这场竞争的核心围绕着三个关键的连接层级,那就是Scale-Up(单机柜内扩展)、Scale-Out(跨机柜扩展) 以及InsidePackage(芯片内部连接)。
其中,半导体领域的专家Credo Semiconductor,以其SerDes(串行器/解串行器) 技术闻名,该技术充当了将芯片并行数据转换为高速串行信号的翻译器。Credo将其核心技术封装成不同形式,以解决这三个层级的连接问题。然而,这场原本围绕Credo电气(铜线)解决方案的市场,却在2025年12月迎接了一场震撼性的变动。
2025年12月3日,迈威尔科技 (Marvell Technology ) 宣布同意收购Celestial AI,交易金额高达55亿美元。由于Marvell是Credo的直接竞争对手,此次收购使Celestial AI的光子技术成为Marvell挑战Credo现有以电为主的解决方案新一代武器。这也代表着一种根本性的技术分歧,包括Credo通过信号处理延长电互联(铜线)的寿命,而Celestial AI则倾向于直接从芯片开始,完全用光互联取代电气互联的技术。
Credo被视为“务实主义者”,其目标是利用先进的数字信号处理(DSP)技术,使现有通过电传输的铜线基础设施更快、传输距离更远。他们坚信,对于短距离传输而言,电力仍然比光纤更便宜、更简单。
在三个关键的连接层级的Scale-Up(机柜内连接的0.5m至3m距离)部分,因为指的是在单一节点中增加更多算力,在AI应用中通常指将单一服务器机箱,或单一机柜内的多个GPU连接起来,使其功能如同一个庞大的超级大脑,其需要在短距离内完成巨大的带宽和超低延迟。传统的被动铜缆因过于粗大笨重而难以有效布线,而光纤在这些短距离跳转中又过于昂贵且耗电。
对此民信配资端,Credo解决方案是HiWire主动电缆(AECs)。这是Credo在该层级的旗舰产品。AECs是一种铜缆,在两端连接器内置入了Credo的重定时器(Retimer)芯片。该芯片在电缆内部清洁和放大信号,使得铜线能够比标准被动电缆更细和更长,同时仍能承载400G或800G等大规模速度。该技术优势是AECs提供了Goldilocks解决方案,比被动铜线更薄、更灵活,且比光缆便宜约50%,功耗低约50%。
其次,在Scale-Out(跨机柜连接的10m至2km距离)的部分,因为Scale-Out涉及连接多个服务器机柜,以构建大规模集群,例如在数据中心大厅连接10,000个GPU。其中的挑战是距离更长。铜线无法达到这么远的距离,物理要求必须使用光(光纤)。但光信号会衰减,需要强大的处理能力来确保ㄌ要完整性。
对此,Credo解决方案是光学DSP。Credo通常不制造整个光收发模块,而是销售内部的DSP芯片。DSP是光收发器的大脑,它接收来自交换机的电信号,进行清洁和准备,以便转换成光信号。其技术特点为Credo的DSP使用PAM4调制技术,将更多数据打包到光波中。它们以能效著称,这在数据中心拥有100,000个光模块时至关重要。主要产品包括Dove系列的400G和800G光模块DSP。
最后,在Inside Package(芯片内/小芯片50mm的距离)方面,其由于单一硅芯片的尺寸已达到物理极限,小芯片(Chiplets)成为了解决方案,即将一个巨大的处理器分解成更小、专业化的芯片,然后将它们封装在单一基板上。该技术的挑战是这些小芯片需要即时互相通信,就像它们是一个单一的硅片一样,连接必须极短(毫米级)、极快,并且功耗接近零。
这方面Credo解决方案是SerDes小芯片与IP授权。Credo使其他公司(如自行构建AI芯片的超大规模厂商)能够将这些小芯片衔接在一起。在通过芯片设计公司购买Credo的112G或224G SerDes IP,直接打印到自己的硅片上。或者,Credo出售专用的小硅片(如BlueJay或Nutcracker小芯片),放置在主处理器(XPU)旁边,以处理输入/输出(I/O)。这技术的优势是这使得芯片设计可以专注于运算逻辑,而将封装内部的连接则交给Credo方案来处理。
与Credo的务实策略形成鲜明对比,Celestial AI是未来主义者。其核心目标是通过将光子直接引入运算芯片,打破记忆墙(Memory Wall)。他们认为铜线已经走到了物理尽头,即使是短距离,也必须被光子所取代。
首先在Scale-Up的战场重新定义上,在从机柜到集群的部分,Credo原先的论点是光学对于短距离来说太贵,铜线(AECs)将主宰机柜。但是,Marvell的最新收购直接挑战了这一论点。其中在Celestial AI解决方案部分,使用光纤而非铜线,这部分的解决方案代表铜线已死。因为铜线运行太热,走不远,因此将将数据转换为光信号,以节省功耗和延迟。
虽然Credo AECs在单机柜内连接8-72个GPU方面具有成本和简单性优势,但Marvell/Celestial AI正在将Scale-Up重新定义为多机柜扩展。通过光子,他们可以将1,000多个GPU跨多个机柜连接起来,其速度如同它们位于单一超大规模服务器中。就Credo的看法,如果超大规模厂商需要让1,000个GPU集群充当单一超级节点,铜线AECs在物理上因距离太短而无法做到。所以,Credo可能因此将高端AI训练市场拱手让给Marvell。
其次,在Scale-Out方面要扩展内存做法上,在传统的跨机柜连接中,Credo扮演着传统角色,销售用于标准光收发器的DSP芯片。但Celestial AI试图取代传统的Scale-Out概念。也就是他们使用光子来扩展内存,希望允许位于机柜A的GPU能够通过光直接访问位于机柜Z的内存,绕过标准以太网的拥堵。如此,可以有效地试图将Scale-Out问题转变为Scale-Up解决方案。
至于,在芯片内连接方面,这是对Credo的IP授权业务最具技术性和潜在致命性的威胁。这是因为Credo解决方案的限制,电信号(SerDes)必须从芯片的边缘进入。随着芯片功能越来越强大,芯片边缘用于插入线路的空间正在耗尽,这限制了连接数量的上限。
反观,Celestial AI解决方案的优势,其技术基础是光子,使用嵌入硅中的激光和波导,可通过OMIB(光学多芯片互联桥)将光直接导入芯片中心。这使得光可以垂直或穿过芯片中心布线,不受边缘限制,这使得带宽密度比Credo的电气连接高出10倍以上。此外,它允许芯片访问数米外的外部内存,如同内存就在旁边一样。
通过Marvell的技术,现在可以为下一代大规模AI芯片提供卓越的架构。如果芯片设计需要大规模带宽,他们可能被迫选择Marvell的光学方法,因为他们在物理上无法在芯片边缘装下够多的Credo界面。
然而,尽管面临这场55亿美元Marvell并购Celestial AI的威胁,Credo仍有其稳固的市场地位和防御壁垒。
1. 风险与制造可靠性在Marvell/Celestial的挑战方面,将激光和硅光子学直接集成到运算封装上,在规模制造上极其困难。这涉及散热问题、良率问题(如果激光损坏,整个4万美元的GPU可能报废)和复杂的封装。因此Credo的优势,是铜线技术成熟、稳健且易于制造。微软和Meta等超大规模厂商倾向于规避风险,他们可能会在未来几年继续使用Credo的AECs,因为它们经过验证且可以立即部署。
2. 成本敏感性与市场区隔AI市场可分为“训练”和“推论”两个部分,在训练(Marvell的目标)部分,需要不惜成本的顶级性能,则Marvell很可能在这个领域获胜。至于,在推论(Credo的优势)部分,一旦AI模型训练完成,执行推论需要的带宽较少,但对成本高度敏感。Credo的铜线解决方案比Celestial AI的光学架构要便宜得多。由于预计“推论”市场将比“训练”市场大10倍,Credo仍拥有巨大的增长空间。
3. 供应商锁定担忧超大规模厂商不愿依赖单一供应商,因该旦Marvell垄断了所有这些芯片,因为同时拥有交换机、DSP和光学小芯片的连接,客户将会积极资助Credo,以保持第二个采用铜线的选择存活。
基于以上的几点因素,理解Credo的策略是,优化现有的高速公路,让汽车安全地以每小时200英里的速度行驶。而Celestial AI的策略,则是完全绕过高速公路,以传送门的方式瞬间将货物发送到目的地。
总接来说,这场“光电之战”的结果将决定未来AI数据中心的基本架构上,也就是以电力信号处理的极限延伸为基础,还是以光子连接的颠覆性突破来重塑一切。在可预见的未来, Credo的成本效益和可靠性将使其在巨大的推论市场中占据主导地位,但Marvell/Celestial AI将在新一代大规模AI训练集群中拥有先发制人的优势。
(首图来源:Marvell)民信配资端
在线配资查询机构提示:文章来自网络,不代表本站观点。