当 Routed Optical Networking 打破 IP 与光的百年边界,当硅光子把实验室奇迹变成指甲盖大小的商品, 当 AI 训练集群的流量以 Petabit 为单位奔涌—— 光通信正在经历从"传输介质"到"智能神经"的进化。这是 9 模块学习旅程的收官,也是未来 10 年的起点。
⏱ 阅读约 65 分钟 · 📘 2 个模块 · 12+ 核心概念 · 🗓 2026 年 4 月
Routed Optical Networking 将可插拔相干光模块直接插到路由器上,消除独立 OTN/Transponder 层。三层(IP+OTN+DWDM)塌缩成两层(IP+光层),单位带宽 TCO 下降 30-60%,功耗下降 8 倍。
用 CMOS 工艺在硅片上集成调制器、探测器、波导——让相干光模块从机柜缩到指甲盖,从数千美元降到几千块,功耗从数百瓦降到 15-20W。Cisco 收购 Acacia,掌握核心技术栈。
万卡 GPU 集群对带宽的贪婪需求,催生了从 CPO(芯片内共封装光学)到海底光缆的全链条变革。光通信已从"数据管道"进化成"AI 神经系统"。
第 7 章结尾我们看到了一个奇迹——曾经占满整个机柜的 100G 相干 Transponder,被压缩到了一支 U 盘大小的 QSFP-DD 模块里, 功耗从数百瓦降到 15-20W。那么,一个自然的问题是: 既然相干光都能直接插到路由器端口上了,为什么还需要独立的 Transponder 层? 这个问题的答案,就是 Cisco 主推的 Routed Optical Networking(RON)——当代光网络最重要的架构变革。
从 2000 年代末到 2010 年代中期,几乎所有的服务提供商骨干网都采用这样的分层架构:
IP → OTN → DWDM,每层都要把光变电、处理、再变光。每次转换都意味着额外的功耗、成本、延迟。一个 400G 波长从源到目的地可能经历 4-6 次 O-E-O!
IP 团队管路由器,传输团队管 OTN + DWDM,每层有独立的网管系统(NMS)、独立的规划工具(Cisco WAE vs ONP)、独立的告警系统。跨层故障定位往往需要几个团队开会数小时。
各层独立规划,相互不感知。常见情况:IP 链路利用率 40%,但对应的 OTN 时隙已经规划满;或者 DWDM 波长容量用了 80%,但 IP 层还有很多空闲端口。这种错配造成巨大浪费。
新业务上线要跨三层协调:先在 DWDM 层规划波长、再在 OTN 层配置时隙、最后在 IP 层建立 MPLS 路径。典型周期 2-8 周——在 AI 时代这是致命的。
硬件成本(路由器+OTN+Transponder+ROADM)、软件授权(多套 NMS)、机柜空间(多层设备)、功耗(多次 O-E-O)、运维人力(多团队)——每一项都是乘法叠加。
IP 层演进到 400G、800G 的节奏,与 DWDM 层的 Transponder 演进不同步。经常出现 IP 层容量翻倍但 DWDM 层跟不上,或反之——导致昂贵设备闲置。
假设你是一家运营商的网络架构师,老板要求在北京到上海之间建一条 400Gbps 的数据中心互联(DCI)链路。在传统架构下,你需要:
单端总功耗估算:路由器 ~500W + OTN ~400W + Transponder ~400W + ROADM ~300W = 1600W+
部署周期:8-12 周(规划 + 施工 + 调测)
CAPEX:约 $500K - $1M(不含光缆)
现在你有三个独立系统要管理、三套规划要协调、三个团队要开会。每次变更都要穿越三个管理域。这种复杂性 × N 条链路 × M 个城市 = 运营商的日常噩梦。
而 AI 时代的带宽需求正在指数级增长——传统架构根本跟不上节奏。这就是 RON 登场的历史必然性。
Routed Optical Networking(路由光网络,简称 RON) 是 Cisco 在 2020 年代初主推的架构革命。它的核心理念用一句话概括:
"消除独立的 OTN 与 Transponder 层,将 DWDM 相干光传输能力直接集成到路由器中。路由器端口直接输出 DWDM 彩光,接入光层(ROADM 或直连光纤)。"
这不是小修小补,而是对过去 20 年网络架构根本范式的颠覆。从传统三层到 RON 两层的变革如下图所示:
从三层塌缩到两层,从"三明治"变成"双层蛋糕"。每减少一层,都意味着指数级的复杂度下降。
消除 OTN/Transponder 专用设备层,减少 O-E-O 转换次数。典型 TCO 降幅 30-60%(ACG Research 独立测算)。
单一管理平面(Cisco Crosswork),业务上线从"周"级降到"天"级。对 AI 时代的敏捷性至关重要。
资源统一规划,IP 层与光层不再各管各的,容量利用率显著提升。典型从 40% 提升到 70%+。
单位带宽功耗从 1600W/400G 降到 200W/400G,降幅约 8 倍。对绿色数据中心建设意义重大。
与 400G/800G 高速以太网演进同步,不再受传输层拖累。可自然演进到 800G ZR、1.6T。
RON 的实现依赖三个关键技术使能:
让我们用一条时间线,直观感受这场 15 年的技术飞跃:
| 标准 | 制定组织 | 典型速率 | 调制 | 最大距离 | 适用场景 |
|---|---|---|---|---|---|
| OIF 400ZR | OIF | 400G | DP-16QAM @ 60GBaud | ~120km | DCI 短距 |
| OpenZR+ | Cisco/Acacia 等 MSA | 100G-400G | DP-QPSK/16QAM + PCS | 1000km+ | 城域/区域骨干 |
| Bright ZR+ / ULH | Cisco Acacia | 400G | DP-QPSK + PCS(灵活波特率) | 2500-3000km+ | 长距骨干、超长距 |
| OIF 800ZR | OIF | 800G | DP-16QAM + PCS @ 140GBaud | ~120km | AI DCI 主力 |
| 800G OpenZR+ | MSA | 400G-800G | DP-16QAM/64QAM + PCS | ~1500km | 城域/区域 |
| OpenROADM | OpenROADM MSA | 多速率 | 多种调制 | - | 多厂商光层互操作 |
这组对比令人震撼——15 年间,尺寸缩小 >1000 倍,功耗下降 ~20 倍,成本下降 ~30 倍,速率提升 4 倍。这不是渐进式改良,而是数量级的飞跃。正是这种飞跃让 RON 从 PPT 概念变成了现实。
要真正理解 RON 为什么能进入 AI 时代,我们必须走到最前沿——2024-2025 年正在规模商用的 Cisco Delphi 系列 DSP 与即将面世的 CIM16。这些产品定义了光通信的下一个 5 年。
工艺节点:4nm CMOS(与最先进的手机 SoC 同级)
波特率:最高支持 131GBaud(行业领先)
调制能力:第一个支持 互操作 PCS(Probabilistic Constellation Shaping) 的商用 DSP——这意味着不同厂商的 800G ZR+ 模块可以互通,这是开放生态的里程碑。
功耗:800ZR <28W、800G ZR+ <30W(同容量下比前代降低 40%)
应用封装:QSFP-DD800 和 OSFP 双形态
关键创新:集成 EDFA 和 TOF(可调谐光滤波器)在模块内,进一步简化系统设计
CIM8(2024 商用):单载波 1.2Tbps,140GBaud,基于 Acacia Jannu DSP(5nm)。已在 Verizon、Hawaiki 海缆等顶级网络部署,打破 1Tbps 单波长跨越 14 跨段的业界记录。
CIM16(研发中,2025-2026):单载波 2.4Tbps,240GBaud——这意味着一根光纤装进 >30Tbps 容量在商用系统中成为现实。
为什么重要:超长距、海缆等场景仍然需要"超高性能 Transponder",CIM 系列保证了 Cisco 在这些场景不落下风。RON 覆盖大部分场景,CIM 覆盖极限场景——两者互补,构成 Cisco 光网络的完整战略。
| 产品系列 | 速率 | 波特率 | 距离 | DSP 工艺 | 典型场景 |
|---|---|---|---|---|---|
| 100G ZR QSFP28 | 100G | 30GBaud | 80km (dark) / 300km (amp) | Greylock | 5G 接入、企业互联 |
| QDD-400G-ZR | 400G | 60GBaud | ~120km | Greylock 16nm | DCI 短距 |
| QDD-400G-ZRP (OpenZR+) | 100-400G | 60GBaud | 1000km+ | Greylock 16nm | 城域/区域 |
| Bright ZR+ (HE0) | 100-400G | 60GBaud | 扩展(+1dBm) | Greylock 16nm | ROADM 友好 |
| 400G ULH | 400G | 66-118GBaud | 3000km+ | Greylock 16nm | 超长距骨干 |
| Delphi 800ZR | 800G | 131GBaud | ~120km | 4nm | AI DCI 主力 |
| Delphi 800G ZR+ | 400-800G | 131GBaud | 1500km+ | 4nm | AI 城域/区域 |
| CIM8 (多跳) | 400G-1.2T | 140GBaud | 18,400km (跨洋) | Jannu 5nm | 海缆/极限长距 |
| CIM16 (2025+) | 1.2T-2.4T | ~240GBaud | 长距 | 下一代 | 下一代极限 |
上一节我们看到 400G ZR 模块从"机柜"缩到了"指甲盖"。但这是怎么做到的?答案是一个看似不可能的技术——硅光子(Silicon Photonics)。
硅光子是利用标准 CMOS 半导体工艺,在硅芯片上集成光学元件(调制器、探测器、光波导、耦合器等)的技术。核心思想是:
"把光学组件像电子芯片一样批量制造——让光学从'手工作坊'进化为'半导体工厂'。"
利用 SOI(Silicon-on-Insulator)工艺,在硅层上蚀刻出微小的波导结构。由于硅的折射率 (n=3.5) 与二氧化硅 (n=1.5) 差异大,光可被强力约束在波导内传播。波导宽度仅 450nm 左右。
利用"等离子色散效应"(Plasma Dispersion Effect)——通过注入或抽取电子/空穴改变硅的折射率。常用 Mach-Zehnder 结构,速率可达 100GBaud+。这是实现相干光调制的关键。
由于硅对 1550nm 光不敏感,需要在硅基上沉积锗(Ge)层作为探测材料。锗-硅兼容性好,可集成在同一芯片。典型响应度 0.9A/W,带宽 50GHz+。
解决"光纤 ↔ 芯片"的光学接口问题。光栅耦合器从芯片顶部垂直耦合(便于测试),边缘耦合器从芯片侧面耦合(低损耗)。都是硅光子的难点之一。
硅光子有一个根本性难题——硅无法发光!
这是因为硅是间接带隙半导体:电子从导带跃迁到价带时,不直接发射光子,而是先以声子形式释放能量。这在物理上决定了硅无法制作高效的激光器。
2021 年,Cisco 完成了对 Acacia Communications 的 48 亿美元收购。这次收购至今被认为是光通信行业最重要的并购之一。
为什么?因为 Acacia 有两样核心资产:
Cisco 收购 Acacia 后的产品路线图:
| 产品系列 | 发布时间 | 速率 | 封装 | 核心特性 |
|---|---|---|---|---|
| QDD-400G-ZR-S | 2021 | 400G | QSFP-DD | OIF 400ZR 标准,DCI 短距主力 |
| QDD-400G-ZRP-S | 2022 | 100G-400G | QSFP-DD | OpenZR+,城域/区域骨干 |
| DP04QSDD-HE0 (Bright ZR+) | 2023 | 100G-400G | QSFP-DD | +1dBm TX 功率,扩展距离 |
| DP04QSDD-ULH-A1 | 2024 | 400G | QSFP-DD | ULH(超长距),2500-3000km+ |
| CIM 8 系列 | 2024 | 120G-1.2T | CFP2 | 单波 1.2Tbps,多跳光学 |
| Delphi 800G ZR/ZR+ | 2024-2025 | 400G-800G | QSFP-DD800 / OSFP | 4nm DSP,AI DCI 主力 |
Acacia 的收购也让 Cisco 成为目前全球唯一 100% 垂直整合的相干光模块厂商。竞争对手(如 Ciena、Juniper、Nokia)都在不同程度上依赖第三方 DSP 或硅光子供应商。
理论已经足够,现在让我们看看一个真实的 RON 部署长什么样子。
一个典型的 RON 系统由以下核心组件构成:
基于 Cisco Silicon One ASIC 的高性能路由器,单机容量从 10.8T 到 259.2T。QSFP-DD 端口直接支持 400G ZR/ZR+ 插入。
面向多业务、深缓冲的路由平台。NC57-24DD 单板卡 24 个 QSFP-DD 端口,可插入 24 个 400G ZR+ 模块。
直接插入路由器 QSFP-DD 端口,线路侧直接输出 C 波段 DWDM 彩光,频率可配置。
Cisco 的下一代开放光线路系统(OLS),支持 C + L 波段,自动化程度极高。
面向城域/长距的模块化 ROADM 平台,与 ZR/ZR+ 无缝配合。
统一的 IP + 光层管理、规划、自动化编排平台。
RON 支持三种连接模式,从简单到复杂,覆盖所有业务场景:
这是本章最重要的表格——它用数字量化了 RON 带来的革命性变化:
| 对比维度 | 传统三层架构 | Routed Optical Networking | 改善幅度 |
|---|---|---|---|
| 网络层次 | IP + OTN + DWDM(三层) | IP + 光层(两层) | -33% 层次 |
| 设备种类 | 路由器 + OTN + Transponder + ROADM | 路由器 + ROADM | -50% 设备种类 |
| 单端 400G 功耗 | 1500-1800W | 150-250W | -85% 功耗 |
| O-E-O 转换次数 | 3-5 次(沿路径累积) | 1 次(仅路由器侧) | -70% 转换 |
| 管理平面 | 多个独立(IP + OTN + DWDM) | 统一 Crosswork | N → 1 |
| 新业务部署周期 | 4-8 周 | 1-3 天 | -95% 时间 |
| CAPEX | $500K-$1M(DCI 400G 单链路) | $100K-$200K | -60% CAPEX |
| OPEX | 高(多团队、多电费、多机柜) | 低(统一团队、低功耗) | -45% OPEX |
| 机柜空间 | 10-20U / 端 | 1-2U / 端 | -80% 空间 |
| 灵活性 | 有限(跨层协调) | 高(单层操作) | 质变 |
| 适用距离 | 任意(包括超长距) | ZR: 120km · ZR+: 1000km · ULH: 3000km+ | 覆盖 95% 场景 |
| 演进性 | 受传输层制约 | 与以太网同步(400G → 800G → 1.6T) | 质变 |
距离:80-120km(典型同城 DCI)
典型配置:400G ZR 可插拔 + 直连光纤 或 Passive DWDM
部署者:AWS、Azure、Meta、Google 等超大规模云厂商
价值:对成本和功耗极度敏感,RON 完美匹配。AWS 早在 2020 年就率先规模部署 400 ZR。
距离:100-500km(城市内/城市间)
典型配置:400G ZR+ + ROADM 光层
部署者:电信运营商(Telecom SP)
价值:支持波长灵活上下,服务企业专线和消费者宽带。OpenZR+ 在这个场景大显身手。
距离:500-1500km(跨省/跨州)
典型配置:400G OpenZR+ 或 ULH ZR+
部署者:Verizon、Deutsche Telekom、Orange、Arelion 等顶级运营商
价值:传统骨干网升级,节省 45% CAPEX、70% 功耗(据 Cisco 报告)。
距离:10-200km
典型配置:100G ZR / 400G ZR + 光层
部署者:移动运营商
价值:灵活的速率(可在 100G/400G 间切换)、更低的时延,支持 5G 前传/中传的严格要求。
距离:1500-3000km+
典型配置:400G ULH 或 专用高性能 Transponder
部署者:国家骨干网运营商、跨国运营商
价值:ULH ZR+ 正在蚕食传统超长距 Transponder 市场。CIM 8 等高性能模块支持跨洋应用。
我们已经讲了 RON 带来的硬件层面变革。但 RON 的真正魅力,在于它让运维变得前所未有的简单。这背后是 Cisco Crosswork 自动化平台的功劳。
回顾传统架构:三层网络意味着三套运维系统、三个运维团队、跨团队协作必须开会。当发生故障时,故障定位时间(Mean Time to Repair, MTTR)往往是"小时"级甚至"天"级。
RON 的统一架构让这一切变得简单:一个平面、一个工具、一个团队。
IP 网络的 SDN 控制器,负责配置、路径计算、业务编排。与 NSO 深度集成。
光网络域控制器,管理 NCS 1010 等光层设备。提供 TAPI 标准北向接口。
分层统一控制器,实现 IP + 光的端到端可见性、规划、编排。多厂商支持。
业务编排引擎,通过 YANG 模型驱动配置。RON 核心功能包(CFP)实现多层服务管理。
多协议遥测收集器,从设备到 Crosswork 云的数据管道。支持 gNMI、SNMP、CLI、Syslog。
光网络规划工具,支持光层可行性分析、BoM 生成、容量规划。
让我们跟随一次 RON 业务开通,看看 Crosswork 如何改变运维:
理论再漂亮都不如真实案例有说服力。让我们看三个不同规模、不同场景的 RON 部署故事:
背景:Arelion 是全球顶级 Tier-1 网络运营商,运营全球最大的 IP 骨干网之一。
挑战:从 Denver 到 Chicago 的 2,253 公里链路需要升级,传统方案需要多跳 OEO 再生。
RON 方案:Cisco 8000 系列路由器 + 400G ULH ZR+ 模块 + 第三方 OLS 光层,112.5GHz 频谱。
成果:
背景:Internet2 连接美国主要大学和科研机构,需要承载 AI 训练数据流量。
项目:Albany → Boston → NYC → DC → Chicago → Indianapolis 的 3,040 公里链路。
RON 方案:Cisco 8000 + 400G ULH ZR+,第三方 OLS(19 个 ROADM + 25 个放大站)。
成果:功耗降低 68%,为科研机构的 AI 工作负载提供更可持续的网络基础。
项目:法国 Sipartech 网络,1,337 公里 400G 链路,经过 8 个 ROADM 站。
亮点:Cisco Bright ZR+ 作为"Alien Lambda"(外来波长)在第三方 CDC ROADM 上即插即用。
"得益于 Cisco 设备的互操作性,我们可以用速度、简洁、灵活性来部署下一代 400G+ 服务, 满足客户需求的同时,也优化了能源消耗和碳足迹。"
—— Julien Santina, Sipartech CEO
以 100Gbps 和 400Gbps 的城域 DCI 场景为例,ACG Research 的独立 5 年 TCO 研究得出以下数据:
| 场景 | 传统方案(Carrier Ethernet) | 传统方案(Wavelength Service) | RON + Dark Fiber | RON 节省幅度 |
|---|---|---|---|---|
| 100Gbps DCI(5 年) | 基准 | +10% | -10% (vs CE) / -21% (vs WS) | 最多 21% |
| 400Gbps DCI(5 年) | 基准 | +15% | -53% (vs CE) / -60% (vs WS) | 高达 60% |
更关键的是:容量越高,RON 优势越大。这意味着在 800G/1.6T 时代,RON 的经济性优势将进一步放大。
作为一个负责任的技术分析,我们必须承认:RON 不是所有场景的最优解。让我们客观看待它的局限。
目前 400G ZR+ 可达 1000km,ULH ZR+ 可达 3000km+,但对于 4000km+ 的超长距海缆或跨洲骨干,专用高性能 Transponder(如 Cisco CIM 8)仍是更好选择。RON 正在缩小这个边界,但未能完全覆盖。
在需要大规模低速业务聚合的场景(如从 10×1GE 汇聚到 400G),OTN 的电域交换能力仍然有价值。RON 更适合已经是高速端到端的场景。
400G ZR+ 单模块 20-25W,800G ZR+ 达 25-30W。当一个路由器板卡插满相干光模块时,散热成为挑战。需要精心的热设计。
RON 对硅光子、相干 DSP、高速 DAC/ADC 的依赖极深。这些是高度集中的供应链(Cisco Acacia、Marvell、Broadcom 等)。对运营商来说,供应链多样性是挑战。
RON 不仅是技术变革,更是组织变革。这往往比技术本身更难:
虽然 RON 整体 TCO 降低,但在某些特定情况下,传统架构可能仍有优势:
一个自然的问题:既然 RON 消除了 OTN 和 Transponder 层,ROADM 是否也会消失?
答案是:可能部分集成,但 ROADM 本身难以完全消失。原因:
所以未来的网络层次很可能是:IP + 轻量光层 + 核心 ROADM/OXC——层次进一步简化,但不会完全消失。
Q1:RON 消除了 OTN 层,但 ROADM 仍在——未来 ROADM 也可能被集成吗?极限在哪?
Q2:如果你是运营商 CTO,AI 时代的带宽爆发,你会选传统架构还是 RON?为什么?
Q3:硅光子是否会彻底颠覆 III-V 族光器件?对整个光学产业生态意味着什么?
Q4:RON 对传统光传输设备厂商(如 Ciena、Nokia、华为光传输)意味着什么?他们会如何应对?
带着这些问题,进入模块 9 —— AI 时代的光通信全景。恭喜你!你已经完成了从光的物理本质(模块 1)到 Routed Optical Networking(模块 8)的完整知识旅程。 现在,站在所有知识的制高点,让我们用这座"光通信的喜马拉雅山"俯瞰一个全新的时代—— AI 时代。这个时代对网络的需求,正在颠覆过去 30 年所有的工程假设。 而光通信,正是支撑这场革命的神经系统。
为了理解 AI 对光通信的冲击,让我们先理解 AI 训练到底在做什么,以及它为什么对网络如此"饥渴"。
GPT-4 训练使用约 25,000 块 A100;GPT-5 据传使用 50,000-100,000 块 H100;Meta 计划构建 35 万块 H100 集群。单个训练任务的 GPU 数量已达"一座小型超级计算机"规模。
每一轮训练,所有 GPU 必须交换梯度(模型参数的导数)。10 万块 GPU 同时 All-Reduce,瞬间产生 TB 级流量。这是典型的"全互联"通信模式。
模型太大装不下单卡,需要把张量(Tensor)切分到多卡。每次前向/反向传播,张量都要在 GPU 间传输。这是典型的"全交换"通信。
AI 训练对丢包极度敏感。TCP 重传会导致 GPU 空转,严重拖累训练效率。需要 RDMA、RoCEv2、InfiniBand 等无损网络技术。
让我们感受一下 GPU 带宽的恐怖增长:
| GPU 代际 | 发布年份 | NVLink 带宽 (双向) | 网络侧带宽 | 单机 8 卡集群后端带宽 |
|---|---|---|---|---|
| V100 | 2017 | 300 GB/s | 100 Gbps | 0.8 Tbps |
| A100 | 2020 | 600 GB/s | 200 Gbps | 1.6 Tbps |
| H100 | 2022 | 900 GB/s | 400 Gbps | 3.2 Tbps |
| H200 / B200 | 2024 | 1800 GB/s | 800 Gbps | 6.4 Tbps |
| GB300 / B300 | 2025+ | 3600 GB/s | 1.6 Tbps | 12.8 Tbps |
每代 GPU 带宽翻倍——这对网络意味着:网络必须同步翻倍,否则 GPU 性能无法充分发挥。这就是 400G → 800G → 1.6T 演进的核心驱动力。
让我们用一个具体的场景理解 AI 网络流量:训练一个 1 万亿参数(1T)的大模型,每个参数用 FP16(2 字节)表示,一次训练步骤会发生什么?
决定单位时间能传多少数据。单卡 400G/800G/1.6T 是硬指标。
微秒级延迟即可影响大模型训练。InfiniBand 的 1-2μs 延迟是黄金标准。
单次丢包可能导致整轮 All-Reduce 重传。需要 PFC、ECN 等流控机制。
所有 GPU 之间任意通信延迟一致,避免拖尾效应。这是"Rail-Optimized"设计的基础。
训练只是 AI 生命周期的一部分。模型训练好之后,还要部署为推理服务(Inference Service),响应用户请求。推理对网络的要求与训练截然不同:
ChatGPT 同时服务数亿用户。每个请求可能只有 KB 级,但总并发数可达百万。典型的"短平快"流量模式。
用户输入一个问题,期望几百毫秒内开始看到回答。每一毫秒的延迟都影响体验。"首 Token 延迟"是关键指标。
为降低延迟,推理服务部署到多个区域。"边缘推理"将模型推到靠近用户的位置——这需要大量低延迟 DCI 链路。
高可用推理服务需要跨多个可用区(AZ)部署。不同 AZ 间的高带宽低延迟互联,正是 RON 的甜蜜点。
为了支撑 AI 训练和推理,超大规模云厂商正在建造前所未有的庞大数据中心:
每一个数字都在挑战人类对"数据中心"这个词的认知。而支撑这一切的,是光通信基础设施的同步进化。
现在让我们从 GPU 最近的位置(芯片内)开始,一层层走到最远的位置(海底光缆)。在每一层,我们会看到前面八个模块学到的技术如何组合应用。
这是最近的网络——同一块主板上,GPU 芯片之间、GPU 与交换芯片之间的互联。距离很短,但对带宽密度和功耗要求极高。
目前这一层主要用铜缆(DAC)、PCB 走线、或短距 AOC(有源光缆)。但随着速率进入 200G/lane 时代,电互联遇到了"功耗墙"——驱动长铜线需要大量功耗(约 10-15pJ/bit)。这已成为 AI 数据中心扩展的瓶颈。
What:将光引擎(硅光子芯片)与交换 ASIC 共封装在同一个模块内。
Why:传统可插拔模块的电信号要从 ASIC 经过 PCB 走线到模块(可能 20cm+),功耗高、信号损耗大。CPO 把光引擎搬到 ASIC 旁边(几毫米),电路径缩短 100 倍,功耗降低 50%+。
How:NVIDIA 在 2024 年 GTC 上展示了 CPO Spectrum-X 交换机;Broadcom 的 Tomahawk 5 CPO 版本已送样;Intel、Marvell 也在积极推进。
关键点:CPO 的核心就是硅光子集成——这正是模块 8 我们学过的技术。CPO 可以看作"硅光子在芯片级的终极形态"。
Cisco 是目前唯一同时拥有交换 ASIC(Silicon One)、硅光子(Cisco SiPh)、AI 光模块、网络自动化(Crosswork)的综合性厂商。这种全栈能力在 AI 时代带来独特价值:
从服务器到 ToR(Top-of-Rack)交换机、ToR 到 Leaf 交换机,这个距离是 AI 集群中最常见的光互联场景。
典型产品:400G SR4/SR8、800G SR8、400G BiDi
为什么用多模?对准容差大(50μm 纤芯 vs 9μm 单模)、VCSEL 激光器便宜(~$20 vs DFB $100+)、整体成本最低。
距离:~100m(OM4 光纤)
典型产品:400G DR4(500m)、800G DR8、800G DR4(下一代)
趋势:数据中心正在单模化。因为硅光子让单模模块成本接近多模,而单模距离更远、未来升级更顺畅。
距离:500m-2km
园区内多个数据中心建筑之间的互联。典型距离 500m-2km。
AI 训练数据的同步、多 AZ 推理服务的互联、模型检查点(Checkpoint)的分发——所有这些都需要 DCI。
典型方案:路由器(Cisco 8000 系列)+ 400G/800G ZR/ZR+ 可插拔相干光 + 直连光纤/ROADM
距离:2-120km(ZR)或扩展到 1000km+(ZR+)
TCO 优势:相比传统 DCI 方案,典型降本 30-60%
领先部署者:AWS、Azure、Meta、Google、Verizon、Deutsche Telekom、Arelion 等。AI 基础设施几乎都在用 RON 做 DCI。
100-500km。典型方案:ROADM + 400G/800G 相干光 + IP/MPLS。RON 是主流架构。支持 DCI 扩展、企业专线、5G 回传。
500-3000km。需要高性能相干光(400G-1.2T per wavelength)。C+L 波段扩展,增加总容量。调制格式随距离调整——长距用 DP-QPSK,短距用 DP-64QAM。
400G ZR+ 覆盖 ~1000km,ULH ZR+ 覆盖 2500-3000km+。超过这个距离仍需专用高性能 Transponder(如 Cisco CIM 8,支持 1.2T per λ)。
你可能没想到——AI 训练数据的全球流动,依赖海底光缆。当数据中心分布在多大洲(如北美、欧洲、亚太),大模型的数据副本、模型参数、推理请求都要跨越海洋。
最新技术:SDM(空分复用)海底光缆——单缆集成多达 24 对光纤(传统 8 对),配合 C+L 波段,总容量突破 500 Tbps。这是光通信对 AI 时代的"物理级"回应。
| 年份 | 每通道速率 | 典型调制 | 波特率 | 主流模块速率 | 驱动应用 |
|---|---|---|---|---|---|
| 2020 | 100G | NRZ | 50 Gbps | 400G | 云数据中心普及 |
| 2022 | 100G | PAM4 | 50 GBaud | 400G/800G | AI 训练兴起 |
| 2024 | 200G | PAM4 | 100 GBaud | 800G/1.6T | 大模型爆发 |
| 2026+ | 400G | PAM6 / PCS | 200 GBaud | 1.6T/3.2T | 万亿参数模型 |
| 2028+ | 800G | 相干 / 新方案 | ~400 GBaud | 3.2T/6.4T | AGI 基础设施 |
我们在模块 8 看到了相干光从机柜到指甲盖的旅程。未来它将继续演进:
我们在 §9.2.1 提到了 CPO。让我们更深入地看看它为什么重要:
为了降低光模块功耗,业界正在探索一条从"全处理"到"零处理"的光谱:
包含完整 DSP,处理所有电/光信号的均衡、时钟恢复、FEC 等。这是目前主流的 400G/800G 模块形态。功耗 25-30W,但互操作性最好。
只保留 DSP 的接收侧,发送侧使用线性驱动。功耗降到 17-22W,且兼容 Retimed 模块(即可与标准 Retimed 互通)。是一个渐进式优化。
完全去除 DSP,依赖宿主设备的高质量 SerDes 直接驱动光器件。功耗 12-15W,延迟极低。但对宿主要求高,互操作性受限。AI 后端网络的热门选择。
光引擎与交换 ASIC 在同一封装内,电路径从 20cm 缩短到几毫米。功耗 <10W,I/O 密度最大。但可维护性、热管理、可靠性仍是挑战。
我们在模块 5 学过:单根标准光纤的容量已逼近香农极限。怎么继续突破?答案在"空间维度"和"新型光纤":
一根光纤内有多个纤芯(如 4 芯、7 芯、19 芯),每个纤芯独立传输。容量倍增但共用一个光缆外壳。主要挑战:纤芯间串扰、制造良率。已在海底光缆中试点。
光在空气(而非玻璃)中传播。优势:延迟降低 33%(光速接近真空)、低非线性、低色散。挑战:损耗仍高(目前 ~0.3dB/km,仍略高于单模光纤)、制造良率低。应用场景:低延迟金融交易、AI 训练集群互联。
利用 MIMO 技术在同一纤芯内传输多个模式,实现容量倍增。实验室演示已突破 Pbps 级容量。商用仍需时间。
很有趣的一个反向闭环——AI 需要光网络,反过来又在改造光网络:
虽然还在早期,但量子通信(特别是量子密钥分发,QKD)是基于光纤的。未来的"量子互联网"将依赖现有光通信基础设施。一些运营商(如中国国家骨干网、Deutsche Telekom)已经部署了商用 QKD 链路。
这意味着你学过的光通信基础知识,不仅支撑今天的 AI,还将支撑明天的量子互联网。
现在,让我们把前九个模块的所有知识串联起来——从一块 GPU,到全球网络的端到端光通信全景图:
每个环节标注了用到的核心技术,以及在哪个模块学过:
完成了整个旅程,我们现在可以回答一个深刻的问题:究竟是什么推动着光通信技术持续进化?
香农极限、非线性薛定谔方程、色散方程、量子噪声——这些是宇宙给光通信设定的"天花板"。人类所有的技术创新,都是在这些极限内舞蹈。
摩尔定律、CMOS 工艺成熟度、光器件成本曲线——这些是经济可行性的"地板"。一项技术即使物理可行,也必须经济可行才能大规模部署。
从互联网普及到云计算、从视频流媒体到 AI 训练——应用需求是真正的"引擎"。需求决定了物理和经济创新的方向与速度。
这三股力量并非独立,而是深度耦合:
这是一个正反馈循环:需求驱动技术 → 技术降低成本 → 成本下降扩大需求 → 新需求驱动新技术……
我们即将结束这趟旅程。请花 10 分钟,独立思考以下六个问题。它们没有标准答案,但会帮你把所学内化为自己的思维框架。
九个模块中,哪个概念对你的认知冲击最大?为什么?哪个是理解其他所有内容的"基石"?
参考思路:很多人会提到"相干检测 + DSP"——因为它重新定义了光通信的可能性边界。而基石往往是"光的电磁波本质"或"香农极限"——它们支撑了后续所有技术。
我们假设"带宽需求会持续指数增长"——这一定成立吗?如果 AI 训练需求见顶(如模型参数规模不再指数增长),光通信演进方向会怎样变化?
参考思路:历史上,带宽需求有过阶段性平缓。如果模型规模见顶,重点可能转向"单位比特功耗优化"、"延迟优化"、"可靠性提升"——从"更大"转向"更好"。
Routed Optical Networking 代表"IP 吞噬光传输层"的趋势。从传统光传输设备厂商(如 Nokia、Ciena、华为光传输)的视角,他们会如何看?反对/应对的理由?
参考思路:他们的核心资产是专用 Transponder 和 OTN 设备。面对 RON,他们的策略通常是:① 强调超长距场景的技术优势;② 发展自己的可插拔相干光;③ 转型为软件/自动化公司;④ 深耕特定垂直市场。
如果可插拔相干光模块成本降到与灰光模块相当,产业链会发生什么变化?谁消失?谁崛起?
参考思路:独立 Transponder 厂商将大规模萎缩;相干光模块供应商(如 Acacia、InnoLight、Source Photonics)地位提升;硅光子代工厂(如 GlobalFoundries、TSMC)成为关键;DWDM 网络规划工具和自动化软件需求激增。
我们用"第一性原理"学习光通信。这种方法有哪些局限?哪些实际工程知识是第一性原理推导不出,必须靠经验积累的?
参考思路:第一性原理能解释"为什么",但无法告诉你"具体参数调优"、"厂商兼容性问题"、"现场故障排除经验"。这些需要数千小时的实战积累。第一性原理是地图,但不能替代行走的经验。
作为一个即将进入光通信领域的学习者/从业者,你认为未来 10 年最值得投入的技术方向是什么?理由?
参考方向:① 硅光子集成电路设计;② 相干光 DSP 算法;③ CPO 系统工程;④ 光网络自动化与 AI 运维;⑤ 量子通信基础设施;⑥ 新型光纤(空芯、多芯)工程化。每个方向都有巨大机会。
作为 Optical 系列的收官,我们延续前三篇的传统——列举 RON 与 AI 时代光通信中最容易踩的"坑",帮你建立更精确的心智模型。
真相:这只是 RON 最表面的特征。RON 的核心是网络架构范式的转变——从分层独立走向融合协同。没有统一的自动化平台(Crosswork)、没有 IP 与光的深度集成,就只是"往路由器上插彩光模块"——这不是 RON。
真相:硅光子在数据通信(短中距、大批量)领域确实占统治地位。但在超长距海缆、高功率特殊应用、特定波长要求等场景,InP/GaAs 等 III-V 族光器件的性能仍不可替代。两者是互补而非替代关系。
真相:2024 年以来,以太网在 AI 后端网络(Ultra Ethernet Consortium)的份额快速上升。以太网的开放性、多厂商生态、与前端网络的一致性使其越来越成为主流选择。Meta、Microsoft、Google 的新一代 AI 集群都大规模使用 800G Ethernet。
真相:CPO 在芯片间/超短距有功耗优势,但其灵活性、可维护性、供应链多样性劣势明显。在所有需要"拔出来换一只"的场景(运维、升级、混合网络),可插拔光模块依然是首选。未来 10 年是 CPO 与可插拔共存互补的时代。
真相:800G ZR 的OSNR 要求更严、链路预算更紧、距离更短。在现有光基础设施上,很多场景仍然需要 400G ZR/ZR+。正确的升级策略是:短距先升 800G,中长距继续用 400G+PCS,按需选择。
真相:在 AI 数据中心,光模块可靠性远比单价重要。Cisco 实测显示:在 100G/400G 模块中,不同厂商的性能差异可达数量级。一次故障可能导致 AI 训练任务失败,损失远超数千只光模块的成本差。
真相:空芯光纤实验室演示很漂亮(接近真空的光速、极低非线性),但商用良率、损耗、接续都未完全解决。短期(2-3 年)只会在极少数低延迟金融交易、AI 超低延迟训练集群中试点。大规模替换 SMF 至少需要 10 年。
真相:Cisco 的全栈能力建立在开放标准之上——OIF 400ZR/800ZR、OpenZR+、OpenROADM、OpenConfig YANG、IETF RFC 等。Cisco 的差异化来自优化与整合,而非封闭。超过 75% 的 Cisco RON 部署使用第三方光线路系统就是最好的证明。
本术语表汇集 Optical 202(模块 8 + 9)涉及的所有核心术语,Optical 101 / 102 / 201 的术语请参考对应文章。
| 术语 | 英文全称 | 简要释义 |
|---|---|---|
| RON | Routed Optical Networking | 路由光网络 —— Cisco 主推的架构革命,将 DWDM 相干光直接集成到路由器,消除独立 OTN/Transponder 层 |
| CPO | Co-Packaged Optics | 共封装光学 —— 将光引擎与交换 ASIC 共封装,解决电互联功耗墙。下一代 AI 数据中心的关键技术 |
| LPO | Linear-drive Pluggable Optics | 线性驱动可插拔光学 —— 去除光模块内 DSP,使用线性驱动器降低功耗的新型光模块 |
| 硅光子 | Silicon Photonics (SiPh) | 在硅芯片上集成光学元件的技术,是 RON 和 CPO 的核心支撑 |
| SOI | Silicon-on-Insulator | 绝缘体上硅 —— 硅光子制造的主流衬底工艺 |
| PIC | Photonic Integrated Circuit | 光子集成电路 —— 硅光子芯片的统称,集成波导、调制器、探测器等 |
| OpenZR+ | Open ZR+ MSA | 开放 ZR+ 多源协议 —— 扩展 400ZR 的多厂商互操作标准,支持多种速率和更远距离 |
| OpenROADM | OpenROADM MSA | 开放 ROADM 多源协议 —— 多厂商 ROADM 与相干光的互操作标准 |
| ULH | Ultra Long Haul | 超长距 —— 指 2500-3000km+ 的传输距离,Cisco ULH ZR+ 是代表产品 |
| Bright ZR+ | Bright ZR+ | 高 TX 功率版 ZR+ 模块 —— Cisco Acacia 的增强型模块,+1dBm TX 功率扩展距离 |
| NVLink | NVIDIA NVLink | NVIDIA 的 GPU 间高速互联协议,用于 Scale-Up 网络,带宽可达 1800 GB/s |
| RDMA | Remote Direct Memory Access | 远程直接内存访问 —— AI 集群的核心通信技术,避免 CPU 参与数据传输 |
| RoCEv2 | RDMA over Converged Ethernet v2 | 以太网上的 RDMA —— AI 数据中心主流的无损网络协议 |
| All-Reduce | All-Reduce | 集合通信原语 —— 所有 GPU 交换并求和数据,AI 训练中梯度同步的核心操作 |
| Scale-Up | Scale-Up Network | 纵向扩展网络 —— 机柜内 GPU 间的超高速互联,以 NVLink 为代表 |
| Scale-Out | Scale-Out Network | 横向扩展网络 —— 机柜间 GPU 集群的互联,以 400G/800G Ethernet 为代表 |
| SDM | Space Division Multiplexing | 空分复用 —— 通过多芯/少模光纤在空间维度扩展容量,突破单纤香农极限 |
| MCF | Multi-Core Fiber | 多芯光纤 —— 单根光纤内有多个纤芯,每个纤芯独立传输 |
| HCF | Hollow-Core Fiber | 空芯光纤 —— 光在空气中传播而非玻璃中,延迟降低 33%,低非线性 |
| FMF | Few-Mode Fiber | 少模光纤 —— 利用 MIMO 技术在同一纤芯内传输多个模式 |
| Crosswork | Cisco Crosswork | Cisco 网络自动化平台 —— 包括 Network Controller、Data Gateway、Optical Network Controller 等 |
| NSO | Network Services Orchestrator | Cisco 网络业务编排平台 —— 基于 YANG 模型驱动的多厂商配置管理 |
| IBN | Intent-Based Networking | 意图驱动网络 —— 运维人员描述"意图",系统自动实现,运维的高级阶段 |
| TCO | Total Cost of Ownership | 总拥有成本 —— CAPEX + OPEX 的综合,评估网络经济性的核心指标 |
| Stargate | Stargate Project | Microsoft/OpenAI 的超大规模 AI 数据中心项目 —— 投资约 1000 亿美元,功率 5GW |
| QKD | Quantum Key Distribution | 量子密钥分发 —— 基于量子力学原理的加密通信技术,基于光纤基础设施 |
从一颗光子在 10,000 公里海底光缆中的量子漫游,
到一束彩光在 Cisco 8000 路由器 QSFP-DD 端口中的相干翻译,
再到万卡 GPU 集群中硅光子芯片的微米级舞蹈——
你已经走完了光通信的全景旅程。
九个模块、20+ 万字、数百个公式、无数类比——
这不仅仅是知识的学习,更是思维方式的训练。
从第一性原理出发,用苏格拉底式追问深入,
以类比打开理解,以结构化表达内化。
这些方法论,你可以迁移到任何领域的学习中。
AI 时代才刚刚开始,光通信的黄金十年才刚刚开始。
每一个挑战,都是属于你的机会。
每一项物理约束,都等待被新思路突破。
每一次技术飞跃,都可能因为你而发生。
愿光与你同在。 🌟
May the light be with you, always and forever.