火柴盒大小的空间里,藏着激光器、调制器、光电探测器、DSP芯片、硅光波导—— 一个电信号如何在纳秒之间化为光、穿越数千公里、又还原为电? 这是一场深入"黑盒"内部的解剖之旅。
本专题承接前9个模块对光通信原理、光纤、DWDM、相干光、硅光、RON 等主题的系统学习, 将目光聚焦到整个光通信系统中最关键、最复杂、最工程化的组件——光模块。 我们将像医学解剖课一样,把它切开、摊平、标注、追踪信号的每一次跃迁, 最终带你从"理解一颗光模块"升华到"理解整个光通信产业"。
封装、电接口、光接口、标准体系——理解光模块的"外形"才能理解为什么"内部"必须这样设计。
追踪电信号从金手指进入,经CDR、Driver、Laser、Modulator,化为光脉冲射出光纤的完整旅程。
光如何被PD捕捉、经TIA放大、ADC数字化、DSP还原——这是一场"起死回生"的魔法。
解剖光模块的"大脑"——50亿晶体管的相干DSP,FEC、色散补偿、偏振解复用的数字魔术。
两种截然不同的工程哲学——简单之美 vs 极致性能,它们的架构、成本、应用场景的深度对比。
从晶圆到成品的产业化旅程、CPO与LPO的未来革命,以及中国厂商崛起的产业启示。
本章从光模块的外部特征入手:它是一个可插拔的"电↔光翻译官", 通过 金手指(76针)与主机握手、通过 LC/MPO 连接器与光纤握手。 我们将完整梳理 封装演进史(SFP→QSFP28→QSFP-DD→OSFP→CPO)、 功耗散热挑战(1W→40W)、以及支撑整个产业的 四大标准组织(IEEE/OIF/ITU-T/MSA)。 理解外壳,才能理解为什么内部必须这样设计。
解剖开始前,任何医学生都会先观察"标本"的外形——它的尺寸、轮廓、外部接口、与周围组织的连接关系。 只有这样,当我们切开外壳、看到内部的复杂器官时,才能理解为什么每个器官长成这个样子、 占据这个位置、扮演这种角色。光模块亦然。它的"外壳"不是可有可无的包装, 而是由整个产业的标准体系、物理约束、散热现实共同塑造出的工程结晶。
一个可插拔的、将电信号与光信号相互转换的标准化组件。 "Transceiver" 一词由 Transmitter(发射器)+ Receiver(接收器)组合而成, 意味着它同时承担两个方向的信号转换任务。它是主机设备(路由器 / 交换机 / 服务器网卡) 与光纤网络之间的桥梁,是整个光通信系统中最标准化、最可替换、也最能体现工程智慧的一环。
让我们用一句话概括它的身份:如果把路由器想象成一栋摩天大楼,交换芯片(Switch ASIC)是大楼的"大脑", 那么光模块就是大楼每个窗口上的"翻译官"——大脑用电的语言思考, 外界(光纤网络)用光的语言传递信息,翻译官必须在纳秒级的时间内, 把每一个比特从一种语言翻译成另一种语言,而且两个方向同时进行、不能出任何差错。
让我们走近一台典型的 Cisco Nexus 9300 系列交换机或 Cisco 8000 系列路由器。打开它的前面板, 你会看到一排排整齐的金属矩形孔洞——这些孔洞被称为 Cage(笼子), 每一个 Cage 都是一个标准化的"插槽",可以接纳一颗光模块。在一台 1U 高的交换机上, 你可能会看到 32 个 QSFP-DD 或 OSFP Cage, 每个 Cage 可支持 400G 或 800G 的光模块。
图1-1:路由器前面板上的 Cage 阵列与光模块的物理关系示意图(示例展示 16 端口,实际 1U 交换机可达 32 端口)
光模块在系统中扮演着"接力棒"的角色:
这是一个极具工程智慧的设计决策。设想一下,如果光模块被直接焊死在主板上(像以前的某些 10/100/1000BASE-T 固定端口那样),会怎样?
• 僵化:每种距离/速率需要一个独立 SKU,厂商需备大量库存
• 升级困难:想从 100G 升级到 400G?必须换整个板卡
• 故障代价高:一颗光器件失效,可能导致整张板卡报废
• 供应商锁定:无法灵活选择不同厂商的光器件
• 灵活:同一端口今天插 10km LR,明天换成 80km ZR
• 按需升级:Pay-as-you-grow,只买需要的端口
• 热插拔:单颗故障只需更换模块,不影响业务
• 多源供应:MSA 保证了多厂商互换性
这种"可插拔"的设计哲学,把光器件的多样性和灵活性与交换芯片的规模化和稳定性解耦, 是过去20年光通信产业能够高速演进的关键基石。Cisco 在其技术文档《Cisco Optics 101》中特别强调: "Pluggable modules allow wide range of deployment options between switch and compute equipment with compatible modules."
理解光模块时,要建立一种"两面黑盒"的思维:
光模块就像国际机场的同声传译耳机——戴上它,你说中文,耳机里传出的是英文; 对方说英文,你听到的是中文。你不需要懂英文,对方不需要懂中文,耳机内部的芯片做了所有翻译工作。 更妙的是,这副耳机是"可插拔"的:今天戴中英翻译版,明天换成中日翻译版, 设备没变,能力变了——这正是光模块的哲学。
要真正理解光模块的外壳为什么长成今天这个样子,必须回溯它的演进史。每一代封装的诞生, 都对应着一次速率跃升、一次功耗挑战、一次散热革命。这段历史,就是整个光通信产业过去 30 年的缩影。
Form Factor 不仅仅是"外形尺寸",它是一个完整的机械 + 电气规范体系,
定义了以下要素:
• 机械尺寸:长、宽、高,以及拉手、卡扣的精确规格
• 金手指引脚定义:每一个触点的功能、信号类型、电压范围
• Cage 规格:主机侧接纳模块的连接器和笼子设计
• 最大功耗:决定了模块内部能放多少芯片、支持多高速率
• 散热设计:热界面材料、散热片、气流通道
Form Factor 的制定由多个产业组织协同完成。我们前面已经接触过这些"规则制定者",这里再系统梳理一下:
定义以太网的 PHY 层规范,包括光接口的调制、编码、FEC、光功率、波长等所有参数。例如 802.3bs 定义了 400GBASE-DR4/FR4/LR4。
Optical Internetworking Forum,专注于电接口(CEI)和相干光接口(400ZR、800ZR、1600ZR)的规范制定。同时定义 CMIS 管理接口。
国际电联,负责 DWDM 波长栅格、OTN 帧结构、光传输网管理等电信级标准。
如 QSFP-DD MSA、OSFP MSA、100G Lambda MSA、OpenZR+ MSA 等。厂商自发组织,制定机械和电气互换性规范。
这种"多组织协作、多层次标准"的生态体系,确保了来自不同厂商的光模块能够互换使用、 共享同一个产业基础。这是可插拔光模块数十年繁荣的根基。
下面这张表,浓缩了从 1990 年代至今整个光模块封装的演进史。请仔细品读——每一行都是一个时代。
| Form Factor | 推出年份 | 尺寸(约) | 最大功耗 | 典型速率 | 电通道 | 主要应用 |
|---|---|---|---|---|---|---|
| GBIC | 1995 | 大(30×65mm) | — | 1G | 1×1G | 早期企业网,已退役 |
| SFP | 2001 | 14×57 mm | 1 W | 1G / 100M | 1×1G NRZ | 接入网、企业交换机 |
| XFP | 2002 | 18×78 mm | 3.5 W | 10G | 1×10G NRZ | 电信设备(逐步被 SFP+ 取代) |
| SFP+ | 2006 | 同 SFP | 1.5 W | 10G | 1×10G NRZ | 数据中心 10GbE 主力 |
| QSFP+ | 2010 | 18×72 mm | 3.5 W | 40G | 4×10G NRZ | 数据中心 40GbE |
| CFP / CFP2 / CFP4 | 2010s | 大(CFP:82×144mm) | 高(≥10W) | 100G–400G | 多样 | 电信传输、早期相干(退役中) |
| SFP28 | 2014 | 同 SFP | 1.5 W | 25G | 1×25G NRZ | 数据中心 25GbE、5G 前传 |
| QSFP28 | 2014 | 同 QSFP+ | 3.5 W | 100G | 4×25G NRZ | 数据中心 100GbE 主力 |
| SFP56 | 2018 | 同 SFP | 1.5 W | 50G | 1×50G PAM4 | 5G 前传、数据中心升级 |
| QSFP56 | 2018 | 同 QSFP+ | 5 W | 200G | 4×50G PAM4 | 数据中心 200GbE、HPC |
| QSFP-DD | 2016 | 18.35×89.4 mm | 14–18 W | 400G / 800G | 8×50G / 8×100G PAM4 | 当前数据中心主流 |
| OSFP | 2016 | 22.58×107.8 mm | 15–25 W+ | 400G / 800G / 1.6T | 8×50G / 8×100G / 8×200G PAM4 | AI / HPC / 相干 DCI 主流 |
| QSFP112 | 2021 | 同 QSFP+ | ~9.5 W | 400G | 4×100G PAM4 | NIC 侧连接、高密度 400G |
| QSFP-DD800 | 2021 | 同 QSFP-DD | ≤18 W | 800G | 8×100G PAM4 | 下一代数据中心 |
| OSFP-XD / OSFP1600 | 2024 | 稍大于 OSFP | ≤40 W | 1.6T / 3.2T | 8×200G / 16×200G PAM4 | AI 超大规模集群 |
| CPO | 2024+ | 共封装(不可插拔) | 极高密度 | 1.6T – 数十 T | 直接集成在交换 ASIC 旁 | 下一代 AI 数据中心(未来) |
从这张表可以读出几条清晰的规律:
图1-2:QSFP28 / QSFP-DD / OSFP 三大主流封装外形按真实尺寸等比例对比
QSFP-DD 是由 QSFP-DD MSA 于 2016 年定义的封装,它是当前数据中心中最成功的封装之一。 它的巧妙之处在于:在几乎不改变外形尺寸(长度增加约 17mm)的前提下,把电通道数从 4 个扩展到 8 个。
实现这一点的关键技术是双排金手指触点——在原本 QSFP28 的金手指触点下方, 再增加一排触点,使总触点数从 38 个(QSFP28)增加到 76 个。 这种设计不仅把通道数翻倍,还保持了向后兼容性:老的 QSFP28/QSFP56 模块可以直接插入 QSFP-DD 的 Cage 使用,只是下排触点空置不用。这种兼容性对数据中心运营商来说价值连城。
QSFP-DD 的散热设计采用 Riding Heatsink(骑式散热片) 方式—— 散热片属于 Cage(主机侧),而非模块本身。模块插入时,Cage 顶部的弹性散热片压在模块表面, 通过 TIM(热界面材料)传导热量。这种设计让散热片可以针对系统优化(尺寸、材料、风道), 而不受限于模块尺寸。
OSFP 是由 OSFP MSA 独立制定的封装,它选择了一条与 QSFP-DD 不同的道路: 不追求与老封装的向后兼容,而是从零开始设计一个真正为高功耗、高速率而生的新外形。
OSFP 的外壳比 QSFP-DD 稍大(宽 22.58mm、长 107mm),并且最具标志性的是—— 它的散热片集成在模块本身(Integrated Heat Sink),模块顶部就是散热鳍片。 这种设计的优势是:散热片可以设计得更高、更大,热阻更低,从而支持更高的功耗上限(25W+)。 这就是为什么高端的相干光模块(如 800G ZR+)和下一代 1.6T 模块会选择 OSFP。
OSFP 还有一个变体叫 OSFP-RHS(Riding Heat Sink)—— 这个版本的散热片反而放在 Cage 上,模块本身没有散热鳍片。这是为了适配 NIC(网卡)等受空间限制的场景。 这种灵活性让 OSFP 能在数据中心的多种位置使用。
尽管 QSFP-DD 和 OSFP 是旗舰,但不要小看 QSFP28 / QSFP112 这些"小"封装。 它们在 NIC(网络接口卡)侧 和 面板空间受限的场合具有不可替代的地位。 QSFP112 特别是 AI 服务器 GPU 网卡(如 NVIDIA ConnectX-7 400G 版本)的标配。
Cisco 通过 Breakout(扇出)技术,让一颗 800G QSFP-DD/OSFP 可以拆成 2×400G QSFP112 或 8×100G QSFP28 连接。 这使得高密度 800G 交换机可以灵活连接各种速率的服务器和下游设备, 极大提升了网络的灵活性和投资保护。
从 2020 年起,数据中心的主流封装之争集中在 QSFP-DD 和 OSFP 之间, 两者形成了独特的分工格局:
• 数据中心交换机主流(400G/800G)
• 向后兼容 QSFP28/QSFP56,保护投资
• 散热相对有限,适合 ≤18W 的直接检测模块
• 生态成熟,客户基础广泛
• AI / HPC 高性能计算集群
• 相干 400G/800G ZR+ 长距模块
• 散热能力强,可支持 25W+ 高功耗
• 面向未来 1.6T/3.2T 速率
关键洞察:两种封装并非"你死我活"的对立,而是针对不同场景的分工。 Cisco 的策略是两种都支持——例如 Cisco 8111-32EH(32 端口 800G)支持 QSFP-DD, 而 Nexus 9232E 和某些高端型号支持 OSFP,让客户可以根据应用场景灵活选择。 未来的 1.6T/3.2T 时代,可能会出现新的封装(如 OSFP-XD)来应对更高功耗挑战, 但这种"多封装共存"的格局会长期延续。
上半部分我们理解了光模块的"外形哲学"。现在让我们走近它的两端: 一端是插入主机的金手指(电接口),另一端是连接光纤的光接口。 这两端是光模块与外界的两次"握手"——一次是与电子世界的握手,一次是与光学世界的握手。 握手的规范(Protocol),就是整个光通信生态得以互联互通的基石。
拿起一颗光模块,你会在它的一端看到一排闪着金光的金属触点——这就是 金手指(Edge Connector / Gold Finger)。之所以镀金,是因为金不氧化、 导电性好、接触电阻稳定——这是高速电信号最需要的品质。
不同封装的触点数量差异巨大,而每一个触点都有精确定义的功能:
| 封装 | 触点总数 | 高速数据对 | 低速控制 | 电源/地 |
|---|---|---|---|---|
| SFP / SFP+ | 20 | 1 TX + 1 RX 差分对 | I2C、LOS、TX_DIS 等 | 3.3V + GND |
| QSFP28 | 38 | 4 TX + 4 RX 差分对 | I2C、ModSel、Reset、Int 等 | 3.3V + 大量 GND |
| QSFP-DD | 76(双排) | 8 TX + 8 RX 差分对 | 同 QSFP28 扩展 | 3.3V + VccTx + 大量 GND |
| OSFP | 60+(两组) | 8 TX + 8 RX 差分对 | 类似 QSFP-DD 但优化 | 独立 3.3V 与 GND 域 |
让我们打开这些触点的"功能分类":
图1-3:QSFP-DD 金手指触点功能分布示意图(含 76 针功能百分比统计)
把金手指按功能分类,可以看到六类触点各司其职:
如果把光模块比作一个国际大使馆,那么金手指就是大使馆与东道国政府之间的"外交通道": 高速差分对是外交电报线(承载机密高速数据); I2C是日常公文传递(管理、监控); 电源/地是基础设施(供电供水); 控制/状态信号是紧急电话(告警、命令)。 每一类通道都不可或缺,但它们的带宽、重要性、频率截然不同。
在 QSFP-DD 金手指的那 8 对 TX + 8 对 RX 差分对上,流淌的是当今电子世界最高速的信号之一。 它的速率演进路径,与光模块速率演进几乎同步:
| 时代 | 单通道速率 | 调制方式 | 电接口标准 | 典型模块速率 |
|---|---|---|---|---|
| 2006 | 10 Gbps | NRZ | XFI | SFP+ 10G |
| 2014 | 25 Gbps | NRZ | CAUI-4 / 25GAUI | QSFP28 100G(4×25G) |
| 2018 | 50 Gbps | PAM4 | CEI-56G-VSR | QSFP56 200G(4×50G) |
| 2020 | 100 Gbps | PAM4 | CEI-112G / 100GAUI-1 | QSFP112, QSFP-DD800(8×100G) |
| 2024+ | 200 Gbps | PAM4 | CEI-224G | OSFP1600, QSFP-DD1600(8×200G) |
为什么要引入 PAM4? 这个问题我们在前面已经讨论过,这里从"电接口"角度再强调一次: 当你想把电信号做到 50G/100G 的数据率,如果仍然用 NRZ(每符号 1 bit),意味着波特率要达到 50/100 GBaud—— 在 PCB 上驱动这么高频率的信号极其困难(衰减、反射、串扰几乎无法承受)。 于是产业选择了 PAM4:每个符号携带 2 bit, 波特率只需 25/50 GBaud,电路实现压力大大降低。代价是信噪比损失约 9.5dB, 这就需要更强的 FEC 和 DSP 均衡来补偿。
金手指上跑的 100G PAM4 信号面临三大挑战:
PCB 走线、连接器、金手指界面的频变损耗。到 100G PAM4(~26.6 GHz 奈奎斯特)时,插损可达 20–35 dB。
时钟不稳定导致信号采样点偏移。随机抖动(RJ)和确定性抖动(DJ)必须严格控制在 ps 量级。
16 个高速差分对挤在金手指上,相互间的远端/近端串扰是信号完整性噩梦。
由 OIF 制定的光模块管理接口统一规范。它规定了主机如何通过 I2C 读写光模块的寄存器,包括身份识别、状态监测、配置下发、固件升级等。 可以把它理解为光模块的"操作系统标准"——让任何厂商的模块都能用同样的方式被管理。
在 CMIS 出现之前,光模块管理接口是一片"战国时代": SFF-8472(SFP)、SFF-8636(QSFP28)各有各的寄存器布局。到了 400G/800G 时代, 数据中心需要管理的光模块可能成千上万颗,每种模块都有不同的管理接口——这是运维的噩梦。
OIF 于 2018 年推出 CMIS,到 2023 年已演进到 CMIS 5.2。CMIS 的核心价值包括:
光模块内置的实时自监测系统,持续采集内部关键参数并通过 I2C 上报给主机。 这是光模块从"哑巴器件"进化到"智能器件"的关键一步。
DDM 的五大核心监测参数:
典型工作范围:0°C ~ 70°C(商温级),工业温级达 -40°C ~ +85°C。温度过高直接威胁激光器寿命和波长稳定性。
监测 3.3V 主电源(告警阈值 ±5%)。电源纹波过大会导致 DSP 判决错误。
典型值 30–80 mA。偏置电流缓慢上升是激光器老化的最明显信号——预示寿命终点。
通过 Monitor PD 测量,典型 0~+3 dBm。过低:激光器衰退;过高:可能损坏对端。
诊断整条链路健康状态的黄金指标。突然下降通常意味着光纤损坏、连接器脏污或对端激光器故障。
用 DDM 诊断故障的经典方法:"Tx 侧看 Bias,Rx 侧看 Power"—— 如果 Tx 端 Bias Current 持续爬升、Tx Power 缓慢下降,那是激光器在老化; 如果 Rx 端 Power 突然大幅下降,那一定是链路中间出了问题(可能是光纤弯折、 连接器松动、配线架变动等)。一个有经验的网络工程师,看一眼 DDM 数据, 往往就能定位故障在链路的哪一端。
单模光纤的纤芯直径只有 9 微米——大约是一根头发丝直径的 1/8。 要让两根光纤端面对齐到光能几乎无损耗地跨过,对准精度必须达到亚微米级。 这听起来不可思议,但连接器工程把它变成了一个你用手指就能完成的"插拔"动作。这就是光纤连接器的工程奇迹。
| 连接器 | 直径 | 典型应用 | 光纤数 | 特点 |
|---|---|---|---|---|
| LC | 1.25 mm | SFP+/QSFP28/QSFP-DD(双工) | 单芯(成对使用 Duplex) | 小型化、推拉式,数据中心 60% 以上占比 |
| SC | 2.5 mm | 早期 GBIC、光配线架 | 单芯 | 方形大号、插拔稳固但体积大 |
| MPO / MTP | 多芯并行 | 40G/100G/400G/800G 并行模块 | 8 / 12 / 16 / 24 / 32 芯 | 一次连接多根光纤,数据中心高密度首选 |
| CS | 双 LC 合体 | QSFP-DD 800G 某些变体 | 双芯 | 在 QSFP-DD 面板上可排 4 个 CS(8 芯) |
| SN | 更小 | 下一代超高密度 | 双芯 | 比 LC 更小,用于 1.6T 及以上 |
LC 连接器的精密结构是现代光通信的基础。它的核心是一根 1.25mm 的 陶瓷插芯(Ferrule),插芯中心有一个 125μm 的孔(正好是光纤包层直径), 光纤被精密地粘固在其中,端面经过微米级抛光。当两个 LC 连接器对接时, 两根陶瓷插芯通过一个分裂套筒(Split Sleeve)精确对心, 两根光纤端面以物理接触(Physical Contact)的方式贴合。 这一套机械系统的重复对准精度可以达到 ±0.5 μm。
图1-4:LC Duplex 与 MPO-12 两种主流光连接器对比
👉 一句话洞察:连接器的选择,本质上是在回答"把复杂度放在光器件里,还是放在光纤里"这道工程题。
400G 及以上的光模块,面对一个核心的工程选择:如何在有限的光接口面板上塞进 400G 带宽? 产业给出了两种不同的答案,背后是两种工程哲学:
核心思路:把多个波长复用到一对(TX+RX)光纤上。
代表:400G FR4(4 个 CWDM 波长 1271/1291/1311/1331nm 复用在 1 对 SMF)
优势:只需 2 根光纤(1 对 LC),节约昂贵的光纤布线
代价:模块内需要 WDM 合波器 / 分波器,光器件复杂
核心思路:把数据切分成多路,每路独占一根光纤。
代表:400G DR4(4 路 1310nm,各走 1 根 SMF,共 8 根并行)
优势:模块内 4 个激光器波长相同,光学简单、成本低
代价:光纤用量多(8 根 / 400G 链路),需要 MPO 连接器
如何选择?这是一个经典的"系统成本权衡"问题: 当光纤资源稀缺(如跨数据中心、长距链路),选 Duplex(波分方案); 当光纤资源充裕(如数据中心内部短距),选 Parallel(并行方案)更经济。 有趣的是,Cisco 同时提供两种方案的完整产品线,让客户按场景自由选择—— 例如 Cisco QDD-400G-DR4-S(并行)和 QDD-400G-FR4-S(波分)都广泛部署。
还有一种特殊的"双工"方案叫做 BiDi(Bidirectional)—— 发送和接收用同一根光纤,通过不同波长区分方向。 Cisco 的 400G BiDi 模块(QDD-400G-BD)就是这种技术的代表, 它让客户可以在原有的 40G/100G 多模双工光纤上直接升级到 400G, 每条链路节约 65% 成本——这是一个极具商业价值的创新。
仔细看 LC 连接器,你会发现它有两种"肤色"——蓝色(UPC)和绿色(APC)。 这不是审美选择,而是端面抛光工艺的区别,决定了连接器的回波损耗(Return Loss)性能。
端面平面抛光(0°),经典的"超物理接触"工艺。
回波损耗:≥ 50 dB(反射约 -50dB)
插入损耗:≤ 0.3 dB
用途:大多数数据中心场景。
端面 8° 斜角抛光——反射光会偏离光纤轴向,几乎无法返回。
回波损耗:≥ 65 dB(反射约 -65dB)
插入损耗:≤ 0.3 dB
用途:相干光、PON、高性能 DWDM 系统。
为什么要 APC?相干光模块对反射极其敏感——哪怕 -40dB 的反射光返回 到激光器,都可能让窄线宽激光器的相位稳定性崩溃。PON 系统使用突发模式也对反射敏感。 多花几块钱选 APC 连接器,可以避免数十万元的系统失稳故障—— 这就是那 15 dB 回波损耗差距的真正价值。
关键注意:APC(绿色)和 UPC(蓝色)绝对不能混插! 强行对接会严重损伤端面,并产生巨大插损。这是光纤布线的铁律。
光模块的外壳绝非"塑料壳子"——它是精密设计的金属压铸件(通常为锌合金或铝合金), 承担三大关键功能:
外壳的配合件包括:
如果要我选一个"光模块设计中最关键的难题",我会毫不犹豫地选散热。 一颗 18W 的 800G 模块,体积不到 25 立方厘米——功率密度约 720 W/L,这已经超过了顶级 GPU 的功率密度!
散热为什么如此重要?三个核心原因:
DFB 激光器波长随温度以 0.08–0.1 nm/°C 漂移。温度波动 5°C,波长就漂移 0.4nm——足以让 DWDM 系统 100GHz 网格的通道"窜道"。
相干 DSP 在 7nm/5nm 工艺下,核心结温超过 110°C 就会触发降频甚至停机。而 DSP 本身是模块最大热源(8–12W)。
激光器寿命符合 Arrhenius 方程:温度每升高 10°C,寿命减半。长期高温运行会显著缩短模块 MTBF。
散热路径是一条精心设计的"热量高速公路":
图1-5:光模块散热路径——从芯片结温到机房环境温度的"热量之旅"
TEC(半导体制冷器)——针对极端温度敏感的器件(如 DFB/EML 激光器), 模块内部还会集成一颗 TEC。TEC 基于帕尔贴效应(Peltier Effect), 让电流通过 PN 结时产生温差,实现"半导体冰箱"效果,把激光器维持在 25°C ±0.1°C。 代价是 TEC 本身消耗 0.5–2W 额外功耗, 而且属于"冷端吸热、热端放热"——TEC 的热端仍需要通过模块散热系统排出。
| 模块 | 典型功耗 | 速率 | 功耗/速率(W/100Gbps) |
|---|---|---|---|
| SFP+ 10G LR | ~1 W | 10 Gbps | 10 W |
| QSFP28 100G LR4 | ~3.5 W | 100 Gbps | 3.5 W |
| QSFP-DD 400G DR4 | ~9.5 W | 400 Gbps | 2.4 W |
| OSFP 800G DR8 | ~16 W | 800 Gbps | 2.0 W |
| QDD 400G ZR(相干) | ~15 W | 400 Gbps | 3.8 W |
| QDD 400G ZR+(Bright) | ~20 W | 400 Gbps | 5.0 W |
| OSFP 800G ZR+ | ~25–30 W | 800 Gbps | 3.4 W |
| OSFP 1.6T DR8 | ~25 W(目标) | 1600 Gbps | 1.56 W |
| OSFP L800G LPO(Linear) | ~7 W | 800 Gbps | 0.88 W |
这张表里藏着整个产业的核心故事:
工程极限的拷问:可插拔光模块的功耗上限究竟在哪里? 当一颗模块达到 30W、40W 时,Cage 的散热能力已经接近极限—— 这正是 CPO(Co-Packaged Optics)兴起的根本原因: 当散热和电信号传输都成为瓶颈时,最好的解法就是干脆不要可插拔, 把光引擎直接焊在交换芯片旁边。我们会在子模块 6 深入讨论 CPO。
在专题开始我们就提到过 IEEE、OIF、ITU-T、MSA 这些标准组织。 现在用一个完整视角理解它们的分工:
图1-6:光模块产业的四大标准组织分工示意图
这种"多组织、多层次"的标准体系看似复杂,但它是产业繁荣的基石:
Cisco 在这个生态中既是"标准的使用者",也是"标准的贡献者"—— Cisco 主导或深度参与了包括 100G Lambda MSA、QSFP-DD MSA、400G-BiDi MSA、 IEEE 802.3bs/cu/df 等众多关键标准的制定。这种"既懂技术又懂生态"的能力, 是 Cisco 能在光模块产业保持领导地位的核心原因之一。
接下来进入 子模块二:发射光路(TX Path)完整解剖—— 这是本专题的核心章节,我们将追踪一个电信号从金手指进入到光信号从光纤射出的完整旅程, 深入拆解激光器、调制器、驱动器的工作原理。
本章追踪一个比特从金手指进入、经 CDR/DSP → Driver → 激光器 → 调制器 直到从光纤射出的完整 100ns 旅程。你将深度理解激光器大家族 (VCSEL/DFB/EML/可调谐/ECL 如何各司其职)、MZM 调制器 (相干光的"光子雕刻刀")、以及 4 个 MZM 组成的双偏振 I/Q 调制器—— 这是相干光成本高达直检 5 倍的核心原因。
终于要正式"动刀"了。在前一章,我们理解了光模块的外壳与两端接口; 现在让我们切开外壳,追踪一个比特——它从金手指进入模块的那一刻起, 将经历怎样的奇幻旅程?电压信号如何"点燃"激光?光子如何被精确调制? 最终如何被聚焦进 9 微米的纤芯?这是一场跨越 10 个数量级、 在纳秒内完成的物理魔术。
本章将采用"先总后分"的解剖策略: 先呈现三类典型光模块的发射光路框图(对比视角), 然后逐一深入每个组件,最后以 400G DR4 为样本做完整的信号旅程追踪。
不同应用场景的光模块,发射光路的复杂度天差地别。我们挑三个极具代表性的样本:
图2-1:三种典型光模块的发射光路对比——从最简单的DR4到最复杂的相干ZR
这张图传递了一个关键信息:同样是"把电信号变成光",三种光模块的复杂度相差数量级。 400G DR4 只有 4 个 EML 激光器,架构极其简洁;400G FR4 增加了一个 CWDM 合波器; 而 400G ZR 则出现了 4 个 MZM 调制器、1 个窄线宽 ECL 激光器、1 个超大相干 DSP—— 这种复杂度的跳跃,也解释了为什么相干光模块的成本是直接检测的 5–10 倍。
接下来我们按信号流的顺序,逐一深度拆解每个组件。
当电信号从主机交换 ASIC 出发,要走过以下"崎岖之路"才能到达光模块的金手指:
在这条路上,信号经历了三重劫难:
频率越高损耗越大(趋肤效应、介质损耗)。100G PAM4 信号到达模块时可能衰减了 20–35 dB。
高频衰减导致脉冲展宽,前一个比特"挤"进后一个比特的时隙,造成码间串扰。
PLL噪声、供电扰动让信号边沿在时间轴上"抖动",影响采样准确性。典型要求 < 1 ps RMS。
于是就需要 CDR 和 DSP 作为信号的"门卫+指挥官"—— CDR 负责恢复干净的时钟和数据,DSP 则进行复杂的均衡、编码、预补偿。
从"数据信号本身"中提取时钟信号,并用恢复出的时钟重新判决数据。 它不需要额外的时钟线——这是高速串行通信的关键创新。
CDR 的核心是一个锁相环(PLL, Phase-Locked Loop)。 工作原理可以用一个类比来理解:
想象一个醉酒的爵士鼓手在敲鼓——他的节奏时快时慢、有抖动。 你作为听众,需要跟上他的节拍才能跳舞。你会怎么做? 你会把注意力集中在每一次"咚"的瞬间,持续调整自己的内心节拍, 直到你和鼓手的节奏同步——这就是 CDR 的本质。 它的 PLL 不停地把自己的本地时钟与输入信号的边沿对齐, 一旦锁定,就用这个"干净"的时钟在每个符号的最佳时刻判决 0 或 1。
这是光模块内部电芯片演进最精彩的故事之一:
| 时代 | 速率 | 信号处理复杂度 | 典型芯片 |
|---|---|---|---|
| 10G 时代(2006–2012) | 10 Gbps NRZ | 简单 CDR + 限幅放大 | 小型模拟 IC,几十万晶体管 |
| 25G 时代(2014–2018) | 25 Gbps NRZ | CDR + CTLE 均衡 | SiGe BiCMOS,百万级晶体管 |
| 50G/100G PAM4 时代(2018+) | 50/100 Gbps PAM4 | DSP:均衡 + FEC + 重定时 | 7nm CMOS,10亿+晶体管 |
| 400G ZR 相干时代 | 60 GBaud DP-16QAM | 超大DSP:色散补偿+偏振解复用+SD-FEC | 5nm/3nm CMOS,50亿+晶体管 |
一个震撼的事实:一颗现代 400G ZR 光模块中的 DSP 芯片, 晶体管数量接近一颗 Intel Core i9 CPU。它的设计需要动用台积电 5nm/3nm 最先进制程, 流片成本数千万美元。整个光模块业内,能独立设计相干 DSP 的玩家—— 全球只有不到 5 家(Cisco/Acacia、Marvell、Broadcom、Ciena、Nokia)。 这就是为什么相干光模块的技术壁垒如此之高。
发射侧 DSP 承担以下任务(越往下越复杂):
DSP 输出的是低电压差分数字信号——典型摆幅只有 100–400 mV, 电流仅几毫安。但要让激光器发光、让调制器调制光,需要:
这就是驱动器(Driver)的使命——它就像一台功率放大器, 把 DSP 的低压小电流信号,放大到足以驱动光器件的大电流或高压信号。
必须 ≥ 信号奈奎斯特频率。100G PAM4 需要 > 35 GHz 带宽,200G PAM4 需要 > 70 GHz。
决定调制深度和消光比(ER)。摆幅不够,光信号的"亮"和"暗"区分度就不够。
典型 < 10 ps。边沿太慢会导致眼图闭合、TDECQ 恶化。
PAM4 需要 4 个电平均匀分布;16QAM 需要 16 个星座点均匀——线性度不好,高阶调制就失败。
激光器是发射光路的心脏。从 850nm 的小小 VCSEL 到 C 波段的窄线宽 ECL, 激光器的多样性,直接决定了整个光模块的性能、应用场景和成本。 理解激光器大家族,就理解了光通信的"光源哲学"。
| 类型 | 典型波长 | 线宽 | 调制方式 | 速率 | 典型应用 | 成本 |
|---|---|---|---|---|---|---|
| VCSEL | 850 / 940 nm | 宽(>100 MHz) | 直接调制 | 10–100 Gbps | 多模短距 SR / VR | 💰 最低 |
| FP | 1310 / 1550 nm | 较宽(GHz) | 直接调制 | 1–10 Gbps | 短距 LX(已式微) | 💰 低 |
| DFB | 1310 / 1550 nm | 窄(1–10 MHz) | 直接 / 外调制 | 10–50 Gbps | 中距 LR / DWDM 客户 | 💰💰 中 |
| EML(DFB+EAM) | 1310 / 1550 nm | 窄(1–10 MHz) | EAM 电吸收调制 | 25–200 Gbps | 主流长距/高速 | 💰💰💰 中高 |
| 可调谐 DBR / SG-DBR | C 波段可调(1530–1565 nm) | 窄(<1 MHz) | 外调制 | 25G+ | DWDM 彩光 / 400G ZR+ | 💰💰💰💰 高 |
| ECL(外腔激光器) | C 波段可调 | 极窄(<100 kHz) | 外调制 | — | 相干光专用 | 💰💰💰💰 高 |
VCSEL 的结构如同一个垂直叠起来的"光三明治":
VCSEL 的优势正是其名字中的"垂直":
激光从表面射出,可以在未切割的晶圆上直接测试。成品率极高、成本低。
典型 < 1 mA 就起振,功耗低。直接调制速率可达 50G+ PAM4。
VCSEL 阵列可一次流片几百颗,做 400G SR4 / 800G SR8 非常高效。
工作在 850nm(多模光纤窗口),线宽较宽,仅适合短距多模传输(<100m)。
应用:100G SR4、400G SR8、800G SR8、AI 集群内部短距互联。 Cisco 的代表产品:QDD-800G-VR8(OSFP 800G VR8,50m OM4 多模)。
DFB 是边发射激光器(光从芯片侧面的解理面射出), 其核心创新是在有源区旁边集成了一层布拉格光栅(Bragg Grating)。 这个光栅只对某个特定波长形成强反射,其他波长被抑制——结果就是 DFB 天然输出单纵模, 线宽窄(1–10 MHz),波长稳定。
DFB 的关键特性:
应用:100G LR4 / 400G FR4 / LR4、所有 DWDM 彩光模块、 PON OLT 设备。DFB 是光通信产业的"劳模"——全球每年出货数亿颗。
EML = DFB 激光器 + EAM(Electro-Absorption Modulator 电吸收调制器),两者单片集成在同一颗芯片上。 DFB 持续发光(连续波 CW),EAM 负责"开关"光——这种分工让信号质量大幅提升。
为什么不用 DFB 直接调制(DML)?这是一个理解光通信的关键问题:
想象你用电风扇吹蜡烛。如果你反复开关电风扇(DML方式),
不仅风速在变,电风扇本身也会晃动、加热、变形——结果烛光飘忽不定。
但如果你让电风扇持续吹,改为用纸板挡住再拿开(EML方式),
电风扇状态稳定,烛光变化只取决于纸板——结果更干净利落。
DML 的问题叫"啁啾(Chirp)"——直接调制时激光器的载流子浓度变化,
导致发光波长随信号强度微变。啁啾 + 光纤色散 = 脉冲展宽 = 距离受限。
EML 让 DFB 持续发光(零啁啾),EAM 通过改变对光的吸收率来调制强度——
这就消除了啁啾,大大扩展了传输距离。
EAM 的工作原理基于量子限制斯塔克效应(QCSE, Quantum-Confined Stark Effect)—— 在 InGaAsP 量子阱上施加反向电压,能带倾斜,吸收峰红移,对 1550nm 光的吸收急剧增加。 反向电压让光"消失",零电压让光"通过"——这就实现了强度调制。
应用:EML 是当前 25G+ 长距光模块的绝对主流。 100G LR、400G LR4、所有 25G/50G/100G PAM4 EML 模块都离不开它。 Cisco 的代表产品:QSFP-100G-LR4-S(4 颗 EML 集成阵列,1310nm 四波长,10km)。
在 DWDM 系统中,每个波长对应一个频率槽位(如 C 波段有约 80 个 50GHz 间隔的信道(C+L 扩展可达近 200 个))。 如果每个波长都用固定波长的 DFB,厂商需要备 96 种 SKU——库存压力巨大。 可调谐激光器解决了这个问题:一颗激光器通过电调谐/热调谐,可以覆盖整个 C 波段。
主流可调谐技术:
应用:DWDM 彩光模块(如 QSFP-DWDM 系列)、400G/800G ZR+ 相干光模块。 可调谐激光器是相干光产业链最关键的组件之一。
对于相干光系统,激光器不仅要单纵模、要可调谐,还必须线宽极窄(< 100 kHz)。 为什么?
相干接收的本质是用激光器的相位信息承载数据(QPSK 的 4 个相位、16QAM 的 16 个相位+幅度组合)。 如果激光器的相位本身在剧烈抖动(即线宽宽),就像用一把刻度模糊的尺子去测量毫米级的东西—— 数据无法分辨。
ECL(External Cavity Laser 外腔激光器)是主流方案:在 DFB 芯片之外, 用一段外部谐振腔(可以是衍射光栅或微腔)形成更长的腔长。腔长越长,线宽越窄。 ECL 的典型线宽可达 50–100 kHz, 甚至某些高端产品能做到 10 kHz 以下。
为什么相干光这么"挑剔"?高阶 QAM(64QAM/256QAM)对线宽的要求呈平方关系上升—— 从 QPSK 到 16QAM,允许的线宽降低 4 倍;到 64QAM 再降低 4 倍。 这就是为什么最新的 800G ZR/ZR+ 必须采用业界最好的窄线宽激光器。
基于帕尔贴效应(Peltier Effect)——当电流通过两种不同半导体的PN结时, 一端吸热(冷端)、一端放热(热端)。TEC 把激光器维持在恒定温度(典型 25°C ±0.1°C)。
为什么 TEC 如此重要?三个理由:
代价:TEC 本身消耗 0.5–2W 额外功耗, 可能占整个模块功耗的 20–40%。同时 TEC 是冷端吸热、热端放热—— TEC 的热端产生的热量仍需通过模块散热系统排出,相当于"双重热负担"。
TEC 何时可以省略?短距模块(如 SR、DR)由于距离短, 对波长精度要求不高,通常不配 TEC。中长距模块(LR4、FR4 及以上)则必须配 TEC。 DWDM / 相干光模块更必须用高精度 TEC。
前面我们理解了 DSP、Driver、激光器——现在要进入发射光路的"高阶"环节: 外部调制器。这是整个光通信体系中最精妙的光学器件之一, 也是相干光之所以能实现 16QAM/64QAM 这样复杂调制的物理根基。
回顾一下我们已经知道的:
但要实现 QPSK、16QAM、64QAM 这样的高阶相干调制, 光模块不仅要能调制强度,还要能调制相位(Phase)! 这时,一位能"精确雕刻光的相位和幅度"的主角登场了—— Mach-Zehnder 调制器(MZM)。
基于两路光的干涉实现调制的光学器件。光被分成两路,每路经过可电控的相移段, 两路再合并时发生干涉——通过控制相对相位差,可精确调制光的振幅和相位。
图2-2:Mach-Zehnder 调制器的光学结构示意图
MZM 的工作原理可以用一个经典类比来理解:
想象一条分叉的水渠——水流被分成两条分支,走过不同长度的路径,再在下游汇合。
如果两条支流的水波同步(相位相同),汇合处水位高(相长干涉,光亮);
如果两条支流完全反相,汇合处相互抵消(相消干涉,光暗)。
MZM 的秘密就在于:它用电压改变两臂波导的折射率(通过电光效应),
从而改变光走过的"有效长度",进而改变相位差。
一个小小的电压变化,就能精确控制光的亮暗,甚至连光的"相位"都能随意雕刻。
| 材料工艺 | 电光效应 | Vπ·L 因子 | 带宽 | 尺寸 | 典型应用 |
|---|---|---|---|---|---|
| 铌酸锂 LiNbO₃ | 泡克耳斯效应 | ~15 V·cm | 40 GHz | 几厘米(大) | 早期相干transponder(已淘汰) |
| 硅光子 SiP | 等离子体色散效应 | ~2 V·cm | 70 GHz+ | 毫米级(小) | 当前主流(Cisco/Acacia、Intel、Inphi) |
| 磷化铟 InP | QCSE + 电光效应 | ~1 V·cm | 100 GHz+ | 毫米级 | 超高速、超高性能 |
| 薄膜铌酸锂 TFLN | 泡克耳斯效应 | ~2 V·cm | 110 GHz+ | 毫米级 | 下一代 1.6T / 3.2T(Cisco 布局) |
从这张表可以读出一段浓缩的演进史:
要实现 QPSK 或 16QAM 这样的复数调制,需要同时控制光的 I 分量(In-phase 同相) 和 Q 分量(Quadrature 正交)。I/Q 调制器就是专门干这件事的:
图2-3:400G ZR 的核心——双偏振I/Q调制器内部结构
这张图揭示了相干光模块为什么成本高:一颗 400G ZR 模块内部包含 4 个 MZM! 而这 4 个 MZM 必须高度匹配(工艺差异 < 0.1%),并精确集成 90° 光学相移器。 这就是为什么相干光的光学引擎芯片(OE-MCM)是整个产业技术难度最高的环节之一。
Cisco/Acacia 的 3D Siliconization 技术—— 把 DSP、Driver、TIA、MZM、PD 等多个不同工艺的芯片通过 3D 封装技术集成到同一个 MCM(多芯片模组)中—— 正是 Cisco 相干光模块能做到最小体积、最低功耗、最高可靠性的秘密武器。
在标准 CMOS 工艺的 SOI(Silicon-on-Insulator)晶圆上制作的 MZM 调制器, 利用等离子色散效应(Plasma Dispersion Effect)—— 通过电压改变硅波导中载流子浓度,进而改变折射率。
硅光调制器的革命性意义:
Cisco 的硅光子战略——Cisco 是业内硅光子技术的先行者之一。 早在 2018 年 Cisco 就宣布收购 Acacia(2021 年完成),获得了业界领先的硅光子 + DSP 组合能力。 根据 Cisco 的产品资料,Cisco 的 400G/800G 硅光子光模块(如 QDD-800G-DR8、 OSFP-800G-DR8)采用4 颗 CW 激光器为 8 个通道共用的架构—— 激光器数量减半,可靠性大幅提升,成本也显著降低。Cisco 的 LightCounting 报告指出, 到 2030 年全球 AI 集群 80%+ 的光模块将基于硅光子技术——这是产业的明确趋势。
单颗激光器的调制速率是有极限的——即使最先进的 EML 也很难稳定地调制到 200 Gbps 以上。 要实现 400G/800G/1.6T 总速率,必须把多个光通道合并到有限的光纤资源上。 这个过程叫做光复用(Optical Multiplexing)。
并行方案(Parallel)的思路最简单:每个通道用一根独立光纤。 例如 400G DR4:4 根发送光纤 + 4 根接收光纤,每根承载一路 100G PAM4(1310nm)。
• 4 个激光器波长相同(都是 1310nm),制造简单
• 不需要 WDM 合波器,光学设计大幅简化
• 成本低
• 易于 Breakout(1×400G → 4×100G)
• 需要 8 根光纤(MPO-12 连接器)
• 在光纤资源紧张的场景成本高
• 不适合长距离(每根光纤都需要独立管理)
Cisco 代表产品: QDD-400G-DR4-S(400G QSFP-DD,4×100G PAM4,500m,MPO-12)、 OSFP-800G-DR8(800G OSFP,8×100G PAM4,500m,MPO-12 ×2 或 MPO-16)。
使用间距较大(典型 20nm)的波长栅格,把多个波长的光合并到一根光纤中传输。 "粗"是相对于"密"(DWDM 间距 0.8nm/0.4nm)而言。
400G FR4 使用 4 个 CWDM 波长:1271nm / 1291nm / 1311nm / 1331nm(间距 20nm)。 每个波长承载 100G PAM4。
合波器的核心器件是 AWG(Arrayed Waveguide Grating 阵列波导光栅) 或 TFF(Thin Film Filter 薄膜滤波器)——它们就像光的"棱镜", 能把不同波长的光精确合并到同一根光纤。
对于相干光模块(如 400G ZR),光模块本身只输出单一的 DWDM 波长 (例如 193.1 THz / 1552.52nm)。真正的 DWDM 合波由外部的光线路系统(OLS)完成。 这种设计让一颗 ZR 模块可以配置为任何 C 波段的波长,通过外部 ROADM 或 Mux/Demux 组合成 DWDM 系统。
Cisco 的 NCS 1010 + NCS 1014 就是典型的开放线路系统(OLS), 可以承载来自任何厂商的相干光模块,实现业界领先的 1.2T CIM8 单载波传输。
通过背光监测二极管(Monitor PD)实时测量激光器输出功率, 通过反馈回路调节激光器偏置电流,保持输出功率恒定,不随温度和老化漂移。
激光器有三个"敌人"让它的功率不稳定:
APC 的解法很优雅:
这是一种"负反馈闭环控制"——典型的工程智慧。即使激光器老化使得相同电流下输出功率下降, APC 也会自动增加电流来补偿。DDM 中的 "Laser Bias Current" 指标—— 我们在子模块一讲过的——就是这个偏置电流,它的缓慢上升正是激光器老化的最明显信号。
高功率激光器对人眼存在潜在伤害(尤其是 1310/1550nm 的红外光,肉眼不可见,更危险)。 光模块遵循 IEC 60825-1 激光安全标准,在以下情况会自动关断激光器:
大多数数据中心光模块是 Class 1M 激光产品——正常使用时对人眼无害, 但不能用光学仪器直视。相干光模块(特别是带 EDFA 的 Bright ZR+)输出功率更高(+1 dBm), 安全等级更高。
终于到了最精彩的部分——让我们像追踪一个信使的旅程一样, 追踪一个比特从它进入金手指的那一刻起,到它以光的形式射出光纤为止, 在 10 纳秒内经历的 10 个阶段。
图2-4:一个比特在 400G DR4 中的完整发射旅程
这 10 个阶段,整个过程只持续不到 100 纳秒。在这 100ns 内:
这个 10 步旅程中的每一步都是一个小奇迹, 任何一步出问题整个模块就失效。这就是为什么一颗高质量光模块需要上千小时的 Avalanche 测试、温度循环、老化筛选——因为它必须把这 10 步的奇迹,重复数万亿次无差错。
本章是"起死回生的魔法"——面对经过 120km 摧残的微弱光信号(−20 dBm), 接收端如何精确还原?你将深入 PD 大家族(PIN/APD/BPD)、 超高速 ADC(128 GSa/s = 每 7.8ps 采样)、 以及相干光核心奇迹——90° Optical Hybrid: 它用一个 90° 相移 + 4 个耦合器,从光的干涉中同时提取 I 和 Q 两个分量, 这是整个相干光技术的物理根基。
如果说发射端是一个"创造者"——用电能点燃光、用数学雕刻波形; 那么接收端就是一个"侦探"——面对经过数百公里摧残、已经微弱到几乎消失的光信号, 还要从中准确还原出每一个比特。接收端的挑战往往比发射端更大, 因为信号已经经过衰减、色散、噪声、非线性的"四重磨难",接收端必须把它"起死回生"。
本章将深入拆解接收光路的每一个环节。你会惊讶地发现——相干光接收端的复杂度, 才是整个光模块工程真正的制高点。50亿晶体管的相干DSP、90° Hybrid的精妙干涉、 平衡探测器的差分奇迹、超高速 ADC 的疯狂采样率……每一个细节都是工程的极致。
与发射端类似,接收端的复杂度也是天差地别。让我们先看两种典型架构的对比:
图3-1:直接检测接收与相干接收的架构对比——复杂度相差一个量级
这张图蕴含的对比是极具冲击力的:
• 3 级电芯片:PD → TIA → DSP
• 4 个 PD(每通道一个)
• 没有 ADC(PAM4 在 DSP 内用内嵌采样)
• 没有 LO、没有 Hybrid
• 总功耗约 4W
• 5 级电芯片:PBS → Hybrid → BPD → TIA → ADC → DSP
• 8 个 PD(4 对平衡探测器)
• 4 个超高速 ADC(128 GSa/s)
• LO 激光器 + 2 个 90° Hybrid + PBS
• 总功耗 ~15W
为什么值得付出这么大的代价?因为相干接收能做到直接检测永远做不到的事—— 长距传输(几百公里)、高阶调制(16QAM/64QAM)、DSP 色散补偿。 每一个都是直接检测的"物理禁区"。现在让我们深入每个组件。
基于内光电效应(Internal Photoelectric Effect)—— 当光子能量 hv 大于半导体禁带宽度 Eg 时,光子被吸收、激发出电子-空穴对, 在 PN 结电场作用下分离,形成光电流。光电流与入射光功率呈线性关系:I = R × P。
这是一个简单但深刻的物理过程。让我们用一个类比理解:
想象一面太阳能板——阳光(光子)打在硅晶体上,激发电子跳出束缚态,
形成电流。光电探测器的原理完全相同,只是:
• 太阳能板要的是大电流(发电),结构厚重以吸收所有光
• PD 要的是快速响应(通信),结构精巧、响应时间 < 10 皮秒
一个给人类提供能源,一个给人类提供信息——但内在物理完全一致。
输出光电流与输入光功率的比值,单位 A/W。
典型值:0.8–0.9 A/W(1550nm InGaAs PD)。意思是每 1mW 光功率产生 0.9mA 电流。
决定能支持的信号速率。100G PAM4 需要 > 30 GHz 带宽,相干光 400G 需要 > 50 GHz,800G/1.6T 需要 70–90 GHz。
无光时的漏电流,是噪声来源之一。典型 < 10 nA。暗电流过大会显著降低灵敏度。
每个入射光子转换为电子的概率。优秀的 PD 可达 η > 90%——几乎每个光子都被"抓住"。
| 类型 | 工作原理 | 响应度 | 典型带宽 | 噪声 | 应用 |
|---|---|---|---|---|---|
| PIN 光电二极管 | 简单 PIN 结,电场加速载流子 | 0.8–0.9 A/W | < 100 GHz | 低 | 主流光模块 RX 端 |
| APD 雪崩光电二极管 | 高反偏电压触发雪崩倍增 | 有内部增益(M×R),相当于 ~10 A/W | ~25 GHz | 较高(过剩噪声因子) | 10G/25G ER、PON OLT |
| SiGe / Ge-on-Si PD | 硅基集成 Ge 吸收层 | ~0.8 A/W | > 70 GHz | 低 | 硅光子模块主流(Cisco 重点方向) |
| UTC-PD(单行载流子) | 只靠电子输运,消除空穴拖慢 | ~0.4 A/W | > 100 GHz | 低 | 超高速(1.6T+) |
| 平衡探测器 BPD | 两个匹配 PD 差分工作 | 类 PIN | > 70 GHz | 极低(抑制共模噪声) | 相干光接收核心器件 |
PIN 结构的精妙之处在于"Intrinsic(本征层)":在普通 PN 结的 P 区和 N 区之间, 插入一层几乎不掺杂的"本征区(I 层)"。这一层的作用是:
材料选择取决于工作波长——波长与半导体禁带宽度必须匹配:
APD(Avalanche Photodiode 雪崩光电二极管)在 PIN 基础上多了一个"魔法"—— 在高反偏电压(30–60V)下,PN 结内部形成强电场,初始光生载流子在电场中加速, 撞击晶格产生更多载流子——雪崩倍增。内部增益 M 典型达 10–20 倍。
想象高山上的雪崩——最初只是一小块雪滑落,但滚动中撞击更多的雪、带动它们一起滑落, 最后形成巨大的雪崩。APD 内部也是如此:一个光生电子在强电场中"加速撞击"晶格, 产生更多电子-空穴对,后者再次被加速、再次撞击…… 最终一个光子可以产生 10–20 个电子——这就是它的"倍增"。
APD 的代价:
应用: 10G/25G ER 模块(Extended Reach 40km)、PON OLT(接收来自多个 ONU 的微弱突发光信号)。 例如 Cisco 的 SFP-10G-ER、QSFP-100G-ER4L-S 中就包含 APD。
两个特性高度匹配的 PD 构成差分对,两路互补的光信号分别打在两个 PD 上, 输出电流相减——抑制共模噪声,放大差模信号。这是相干光接收的核心器件。
为什么相干接收必须用 BPD?让我们看信号的数学:
从 90° Optical Hybrid 出来的两路光信号是:
E_s + E_LO(信号光 + 本振光的相长叠加)E_s - E_LO(相消叠加)两个 PD 分别探测这两路光的强度:
I_1 = |E_s + E_LO|² = |E_s|² + |E_LO|² + 2·Re(E_s · E_LO*)I_2 = |E_s - E_LO|² = |E_s|² + |E_LO|² - 2·Re(E_s · E_LO*)
差分输出:I_1 - I_2 = 4·Re(E_s · E_LO*)——只保留了信号与 LO 的交叉项,
这正是包含相位信息的有用信号!
而被抵消的 |E_s|² 和 |E_LO|²——这正是 LO 激光器的强度噪声(RIN)
和其他共模噪声的来源。BPD 的差分结构完美地把它们消除了!
想象两个人同时听一场嘈杂的演讲——一个人站在讲者的正面、一个站在背面。 两个人都听到同样的环境噪声(风声、空调声、其他观众声),但只有正面的人听到讲者的话。 如果让两人描述的声音"相减",共同的噪声被抵消,讲者的声音被保留甚至加强。 BPD 就是这样一对"对称听众"——对共模噪声免疫,对有用信号敏感。
现代集成 BPD 的带宽已达 70–90 GHz,支持 130 GBaud 级的相干信号。 BPD 通常与 TIA、90° Hybrid 一起集成在硅光子芯片上,构成相干光的"接收引擎"。
PD 输出的是极其微弱的光电流——典型数值:
这么弱的电流完全无法直接用——后续的 ADC、DSP 要求输入是几十毫伏到几百毫伏的电压信号。 所以需要一个"桥梁"——TIA(Transimpedance Amplifier 跨阻放大器)。
将 PD 输出的微弱电流转换为电压信号,并进行放大。 基本原理:运放 + 反馈电阻 RF,输出电压 Vout = -Iin × RF。
图3-2:TIA 基本电路——跨阻放大的本质
TIA 设计的核心艺术在于一对永恒的矛盾:
增益 = Rf,大 Rf → 增益高
噪声电流 ∝ √(4kT/Rf),大 Rf → 噪声低
但 Rf 与输入电容 C 形成 RC 极点 → 带宽 = 1/(2π Rf C) → 带宽低
小 Rf → 极点频率高 → 带宽高
但 Rf 小 → 增益低、热噪声大
需要更精密的前置放大
典型的 TIA 设计:
TIA 是模拟 IC 设计的"皇冠"——它工作在输入端最微弱的信号上,任何噪声都会被后级放大。 工艺演进:
集成趋势:TIA 越来越多地与 PD 集成在同一个硅光子芯片内(或紧贴封装), 极短的互连距离避免了信号完整性损失。Cisco 的硅光子 ROSA 就是典型案例。
后级处理:现代 TIA 通常已集成了后续信号调理功能—— CTLE(Continuous-Time Linear Equalizer 连续时间线性均衡器)预先补偿通道损耗, 差分输出对称性也更好。对于 NRZ 信号,还会集成 LA(Limiting Amplifier 限幅放大器); 对于 PAM4/相干信号,后级保持线性以进入 ADC。
前面我们理解了 PD 如何将光转化为电流、TIA 如何将电流放大为电压。 现在要进入相干光接收端最精妙的组件——超高速 ADC、本振激光器、 以及光通信中最美的光学奇迹之一:90° Optical Hybrid。 这是整个光模块技术栈中最接近"物理学极限"的部分。
回顾一下信号处理的演进:
把连续的模拟电压信号转换为离散的数字样本序列。每个样本用若干个比特表示(如 8 bit = 256 个离散电平)。 ADC 是模拟世界与数字世界的"翻译官"。
奈奎斯特定理:采样率必须 ≥ 2 × 信号带宽。
• 400G ZR 信号 ~60 GBaud → 需要 ADC 采样率 ≥ 120 GSa/s
• 800G 信号 ~128 GBaud → 需要 ≥ 256 GSa/s
这是人类电子工程的极限之一!
ADC 的真实分辨率(Effective Number of Bits)。
标称 8 bit,但在超高速下实际 ENOB 可能只有 5.5–6.5 bit。
相干光需要 ENOB ≥ 6 bit 才能支持 16QAM。
超高速 ADC 是 DSP 的主要功耗来源之一。
128 GSa/s 8-bit ADC 典型功耗 1–2W 每路,4 路共 4–8W。
占相干 DSP 总功耗的 30%+。
单个 ADC 达不到 128 GSa/s,通常用 16–32 个子 ADC 交替采样,
每个子 ADC 只需 ~8 GSa/s。
挑战:子 ADC 之间的失配(增益/偏置/时间)必须精确校准。
128 GSa/s 是一个惊人的速度——每 7.8 皮秒采样一次。 单个 ADC 电路远远做不到,于是工程师发明了时间交织(Time-Interleaved)ADC:
想象赛跑比赛的摄像——一个摄像机每秒只能拍 30 帧,根本抓不住冲线瞬间。 但如果用32 台摄像机错开 1/960 秒依次拍摄,组合起来就得到 960 帧/秒的慢动作! 时间交织 ADC 就是这样工作:32 个子 ADC 各自以 4 GSa/s 运行, 但起始时刻错开 7.8 皮秒,组合后就是 128 GSa/s。
但"32 台摄像机"需要精密协调——任何一台时钟抖动或灵敏度偏差,都会让组合后的信号出现"失真尖峰"。 高端相干 ADC 的设计团队,往往需要几十个工程师花数年时间调优这些失配校准算法。 这也是为什么全球能设计顶级相干 ADC 的公司屈指可数。
在 Cisco 的 800G ZR/ZR+ 相干光模块中,ADC 已经完全集成在相干 DSP 芯片内:
根据 Cisco 官方资料,下一代 1.6T 相干模块将使用 240 GSa/s 的 ADC, 采用 3nm CMOS 工艺——这是电子工程的人类极限。
这是理解相干光最关键的概念。让我们回顾直接检测 vs 相干检测的本质区别:
PD 输出电流 I ∝ |E|²——只知道"光的强度",完全不知道光的"相位"和"偏振"。
这就像你只能听到"有没有声音",但听不出"是什么音调"——信息维度损失大半。
把信号光 E_s 和一个已知参考光 E_LO混频,得到 |E_s + E_LO|²。
展开后包含 2·Re(E_s · E_LO*) 这一项——带有信号光的完整相位和振幅信息!
想象你在电话里听到一段音乐,但只能听出节奏的强弱,无法分辨音高——这是直接检测。
现在给你一个标准音叉(振动在 A=440Hz),让它与电话里的声音一起响——
你立刻能从"拍频"中判断音乐的每个音高:音叉就是本振,电话里的音乐是信号。
相干接收的本质就是"用一个已知的光作为尺子",去度量未知信号光的相位、频率、偏振。
LO 就是这把尺子——没有它,相位信息永远无法被复原。
LO 不是随便什么激光器——它必须满足一系列极其苛刻的指标:
现代相干光模块通常集成两颗窄线宽激光器:
在某些设计中,为了节省成本和功耗,单激光器设计也被采用—— 一颗激光器的光被分成两路,一路去发射、一路作 LO。但这种方案在长距应用中受限, 因为回波光会干扰激光器相位稳定性。
Cisco/Acacia 的相干光模块通常采用双激光器方案——信号和 LO 独立, 性能最优。两颗激光器都是硅光子集成、SG-DBR 可调谐结构。
如果要我选一个最能代表"光的魔法"的器件,我会毫不犹豫选 90° Optical Hybrid。 它是一个看似简单的光学网络——几根波导、几个耦合器——但它能从光的干涉中 同时提取出信号光的实部(I)和虚部(Q)分量,这是整个相干光技术的根基。
相干光通信使用复数调制——信号光的电场可以写成复数形式:
Es(t) = A(t) · ejφ(t) = I(t) + j·Q(t)
其中 I(t) = A(t)·cos(φ(t)) 是实部(In-phase 同相分量),
Q(t) = A(t)·sin(φ(t)) 是虚部(Quadrature 正交分量)。
16QAM 的 16 个星座点,就是 I 和 Q 各取 4 个可能值组合出来的。
接收端要做的事:从收到的光信号中,同时恢复出 I 和 Q。 但 PD 只能测 |E|²——一个实数。如何用"只能测实数"的器件,同时拿到"复数信号"的两个分量? 答案就是 90° Optical Hybrid。
图3-3:90° Optical Hybrid——从单一光信号中同时提取 I 和 Q 分量
让我们用简化的数学看看这个"魔法":
设信号光 E_s = A·e^(jφ),本振光 E_LO = B·e^(jωt)(为简化忽略频率偏移)。
90° Hybrid 产生 4 个输出:
差分探测:
于是我们同时得到了信号的 I 和 Q!再加上两路对应 X、Y 偏振,就还原了信号的所有信息。 这个光学器件的精妙之处在于——它用一个 90° 相移器 + 几个简单的 2×2 耦合器, 就完成了把复数信号分解为两个实数分量的物理任务。
相干光使用偏振复用(Polarization Multiplexing)——在一束光里同时传输 X 偏振和 Y 偏振两个独立的数据流,瞬间让容量翻倍。但光纤在传输中会让两个偏振态"混起来"(偏振态旋转)——接收端必须先把它们重新分开,才能分别解调。
在相干光接收端的入口,信号光首先经过一个 PBS(Polarization Beam Splitter 偏振分束器)——这是一个能让 X 和 Y 两个偏振分别走不同路径的光学器件。然后两路偏振分别进入各自的 90° Hybrid 和 BPD 阵列。
但这里有个问题:光纤传输使得"发送时的 X"到接收端可能变成了 "70% X + 30% Y" 的混合! 简单的 PBS 无法还原。真正的偏振解复用必须依靠接收端的 DSP—— 用 MIMO(Multiple-Input Multiple-Output)算法实时跟踪偏振态变化、动态解混。 这是相干 DSP 最关键的能力之一,我们会在子模块四详解。
对应发射端的光复用,接收端需要做光解复用:
MPO-12 → 4 根独立光纤 → 4 个 PD 阵列,各自处理独立通道。光学极简。
一根光纤入 → CWDM 解波器(AWG/TFF)分成 4 个波长 → 4 个 PD。
单波长直接入 → PBS → 双 Hybrid → 8 PD → 4 路 ADC。DWDM 由外部 OLS 处理。
保证某目标误码率(如 BER = 1e-12 或 pre-FEC BER = 2.4e-4)所需的最小输入光功率。 这是评估光模块接收性能的黄金指标。
不同模块的接收灵敏度对比(典型值):
| 光模块类型 | 接收灵敏度 | Tx 功率 | 链路预算 | 备注 |
|---|---|---|---|---|
| 100G LR4 | −8.6 dBm | +4.5 dBm | 6.3 dB | 10km SMF |
| 100G ER4 | −21 dBm(APD) | +4 dBm | 18 dB | 40km SMF |
| 400G DR4 | −6 dBm | +3 dBm | 3 dB | 500m SMF |
| 400G FR4 | −9.2 dBm | +3.5 dBm | 4 dB | 2km SMF |
| 400G LR4 | −10.6 dBm | +4.5 dBm | 6.3 dB | 10km SMF |
| 400G ZR(相干) | −20 dBm(带 FEC) | −10 dBm | 10 dB(单段) | 80–120km 放大链路可达更远 |
| 800G ZR+(含 EDFA) | −24 dBm | +1 dBm | > 25 dB | 数百 km DWDM |
一个震撼的事实:相干光的接收灵敏度比直接检测高 7–15 dB! 这就是为什么相干光可以跑 80km 甚至 1000km+,而直接检测最多 40km。 这 15 dB 的灵敏度优势来自三个源头:
链路预算 = Tx 功率 − Rx 灵敏度
举例:400G FR4 的 Tx 是 +3.5 dBm、Rx 是 −9.2 dBm,链路预算 12.7 dB。 这 12.7 dB 要分摊给:
如果裕量不足——链路在极端条件下(高温、连接器脏污、老化激光器)就会失败。 这就是为什么高质量模块(如 Cisco 光模块)会把指标做得比 IEEE 规范更好—— 保留更多裕量,在现场就更可靠。
现在来做相干光接收端的"终极追踪"。一束来自 120 公里外的光, 功率只有 −20 dBm(0.01 mW),承载着 DP-16QAM 信号—— 它如何在 100 纳秒内被还原为主机可读的数字流?
图3-4:400G ZR 相干光模块接收端的完整信号旅程
让我们欣赏这个过程的壮美——一束在 120km 光纤里几乎被摧毁的光信号, 经过 10 个精密步骤,在 100ns 内被完美还原。这里的每一步都蕴含着深刻的物理和工程智慧:
这是现代光通信最接近"魔法"的部分——它让我们能跨越大陆、跨越海洋、 跨越数据中心之间几十公里的距离,传输每秒上万亿比特的信息,而错误率低于万亿分之一。
本章走进光模块的"大脑"——50 亿晶体管的相干 DSP (接近 Intel i9 规模,5nm/3nm 工艺)。你将理解发射侧 9 步 + 接收侧 10 步的 完整算法链:色散补偿(让 120km 等效为 0km)、 MIMO 偏振解复用(实时跟踪偏振旋转)、 FEC 魔法(11 dB NCG = 距离 +55km)。 DSP 是整个光通信产业最高壁垒的环节——全球仅 3–5 家能设计。
我们在前三章多次提到 DSP。现在终于要正式走进这颗"大脑"的内部。 一颗现代 400G ZR DSP 有 50 亿晶体管,工艺节点为 5nm, 功耗 8–12W——它的复杂度接近 Intel Core i9 CPU。 正是这颗芯片,让光在经历 120km 摧残后仍能被完美还原; 让一根光纤能承载每秒几个 Tbit 的信息;让相干光通信成为可能。 理解 DSP,就理解了现代光通信的算力核心。
打开一颗 400G ZR 光模块,撕开金属外壳,你会看到一块精密布满芯片的 PCB。 让我们来认识这些"居民":
图4-1:典型 400G ZR 相干光模块的内部电芯片布局(俯视示意)
这张图揭示了一个关键事实:现代相干光模块实际上是一个微型"电光计算系统", 包含 9 大类电芯片:
现在让我们深入研究最关键的"大脑"——DSP。
专门用于处理高速数字信号的 ASIC 芯片。光模块中的 DSP 是高度专用化的—— 它不是通用处理器,而是为特定的光通信算法(FEC、色散补偿、均衡等)定制的硬件加速器集合。
现代光模块 DSP 的规格震撼人心:
| 规格 | 100G PAM4 DSP | 400G PAM4 DSP | 400G ZR 相干 DSP | 800G ZR+ 相干 DSP |
|---|---|---|---|---|
| 晶体管数量 | ~10 亿 | ~20 亿 | ~50 亿 | ~80 亿 |
| 工艺节点 | 16nm | 7nm | 7nm / 5nm | 4nm / 3nm |
| 芯片面积 | ~100 mm² | ~200 mm² | ~300 mm² | ~400 mm² |
| 功耗 | ~3W | ~5W | ~10W | ~15W |
| 集成 ADC/DAC | 部分(低速) | PAM4 slicer | 4× 128 GSa/s | 4× 240 GSa/s |
| FEC | KP4 HD-FEC | KP4 + 内部 FEC | oFEC (SD) | 级联 FEC |
一个直观对比:400G ZR 的 DSP 晶体管数量(50亿)已经接近一颗 Intel Core i9 处理器(约 80亿), 而它的工作频率高达 数十 GHz(处理每个 ADC 样本只有 7.8 皮秒)。 这颗芯片的设计和制造,是整个光通信产业最高端的工程成就。
全球能独立设计相干光 DSP 的公司屈指可数——这是产业的顶级壁垒:
技术壁垒为什么如此之高?有三个原因:
这就是为什么这个领域的并购频繁——通用厂商只有通过收购才能快速获得能力(Cisco 收 Acacia、Marvell 收 Inphi)。
现在进入整个专题技术密度最高的部分。我们要拆解相干光 DSP 内部的算法链—— 那些让接收端"起死回生"的数学魔法究竟是什么。
图4-2:相干光发射侧 DSP 9 步处理流程
接收侧 DSP 的处理流程更复杂——这是现代光通信真正的魔法所在。 它要把一个经过 120km 摧残、色散严重展宽、偏振混乱、相位漂移的信号, 还原为清晰的比特流。我们来逐步深入每一个关键算法。
图4-3:相干光接收侧 DSP 10 步算法链
这是相干光最革命性的能力。让我们看看它的原理:
光纤色散导致不同频率的光以不同速度传播,脉冲在时间上被展宽。 从数学上,色散的传递函数是:
HCD(ω) = exp(j · β2 · ω² · L / 2)
其中 β2 是光纤的色散系数,L 是光纤长度。这是一个全通滤波器——只有相位变化,没有幅度损失。 所以色散的"信息"并没有丢失,只是被"打乱"了。
天才的想法:在 DSP 里应用一个反向的传递函数:
H补偿(ω) = exp(−j · β2 · ω² · L / 2)
两者相乘 = 1——色散完全被消除!这就像在数字域"倒放"了光纤里的色散过程。 典型实现:在 DSP 里用频域 FIR 滤波器(FFT → 乘以补偿相位 → IFFT), 可以一次性补偿几万 ps/nm 的累积色散——相当于 3000 公里以上的光纤。
色散就像一群人排队通过一条坑洼的路——有人走得快、有人走得慢,到终点时队形全乱。 DSP 色散补偿就像在终点加一段"逆向坑洼路"——刚才走快的人现在走慢、走慢的走快, 最终队形恢复整齐。因为色散的"信息"完整保留在信号里(只是相位重排),所以可以被精确还原。 这正是相干光超越直接检测的根本原因——直接检测丢失了相位信息, 色散造成的脉冲展宽就永远无法还原。
光纤传输让 X 和 Y 两个偏振态相互混合。接收端的任务是还原原始的 X 和 Y 数据。 这个问题本质上是一个 2×2 线性代数问题:
[Xout, Yout] = [hxx, hxy; hyx, hyy] × [Xin, Yin]
我们需要估计出矩阵 H 的逆,然后应用到接收信号上。 但问题是——接收端不知道 H!没有训练序列、没有前置导频。
解决方案是 盲均衡算法——最经典的是 CMA(Constant Modulus Algorithm 恒模算法): 利用 QPSK 信号"幅度恒定"的特性(16QAM 也可以通过变形处理), 动态调整 4 个 FIR 滤波器(hxx, hxy, hyx, hyy)的权重, 让输出接近恒模——这个过程不需要知道原始数据,所以叫"盲"均衡。
MIMO 2×2 均衡器的自适应性——它每几微秒就更新一次权重, 这让它能实时跟踪偏振旋转的变化(光纤的偏振态会随温度、机械振动变化而漂移)。 这是光通信中最精妙的"实时控制"之一。
即使有了窄线宽激光器,LO 和信号之间仍然有微小的相位噪声和频率偏差。 CPR(Carrier Phase Recovery)算法负责消除这些残余误差:
CPR 对激光器线宽要求非常敏感——这就是为什么子模块三强调 LO 线宽必须 < 100 kHz。 算法再强大,也无法对抗根本性的相位噪声。
如果说色散补偿是相干光的"光学奇迹",那么 FEC(Forward Error Correction 前向纠错) 就是相干光(乃至所有现代通信)的"数学奇迹"。没有 FEC,就没有今天的高速光通信。
FEC 的核心思想惊人地简洁:在数据里添加冗余比特,让接收端可以检测并纠正一定数量的错误。
想象你要发送一句话"HELLO",但信道噪声很大,对方收到的是"HXLLO"。
如果你事先约定:每个字母重复 3 遍——发送"HHHEEELLLLLLOOO",
对方收到"HHXEEELLXLLLOOO",只要投票"多数服从少数",就能正确恢复。
这就是最简单的 FEC 原理:用冗余换可靠性。
现代 FEC 的数学要精妙得多——它用"有限域代数"设计出一种冗余,
可以用很小的开销(如 7%、15%)纠正很多错误。
• 原理:接收端先做"硬判决"(输出 0 或 1),然后 FEC 解码器只处理 0/1
• 典型:RS(255,239)、BCH、KP4 RS(544,514)
• 开销:7%
• NCG:~6 dB
• 应用:100G/400G PAM4 直检模块
• 原理:保留"软信息"(每个比特为 1 的概率,LLR),FEC 解码器利用这些概率
• 典型:LDPC、Turbo、oFEC、cFEC
• 开销:15–25%
• NCG:~11 dB
• 应用:相干光 400G/800G ZR
FEC 为系统带来的有效 SNR 改善(考虑了开销后)。NCG 是 FEC 的终极指标—— 它决定了你的系统能在多差的信号质量下仍然正确工作。
让我们理解 NCG 的经济价值:每 1 dB NCG 意味着什么?
所以当 SD-FEC 提供 11 dB NCG 时,它的真实价值是:
11 dB NCG 就是相干光"跑得比直检远 4 倍"的数学根基。 没有 SD-FEC,400G ZR 根本不可能跑 120km。
现代最先进的相干光模块(如 Cisco 的 800G ZR+)采用级联 FEC—— 两层 FEC 串联,外层 BCH/Staircase + 内层 LDPC,组合达到 NCG > 12 dB。
1948 年,Claude Shannon 证明了信息论的核心定理:对于任何噪声信道, 都存在一个最大容量(香农极限),如果数据速率低于这个极限, 就一定存在某种编码方式让错误率任意小。
现代 SD-FEC + PCS(概率星座整形)的组合,已经把相干光的性能推到距离香农极限 < 1 dB 的位置——这是人类通信技术数十年研究的累积成果。再进一步的空间已经很小了, 未来的容量提升更多依赖光器件(更多波长、更高 SNR)而非编码本身。
光模块内部集成一颗 ARM Cortex-M 级别的 MCU,运行实时嵌入式固件(RTOS)。 它不参与高速数据路径,但管理模块的整个"生命周期":
CMIS 状态机是光模块生命周期的骨架:
MgmtInit → ModuleLowPwr → ModulePwrUp → ModuleReady → DataPathActivated
每个状态都有明确定义的功耗、允许的功能、允许的主机命令。 这是光模块管理标准化的基础。
EEPROM 存储光模块的所有"身份信息"和"校准数据":
一颗光模块需要多路精密电源:
PMIC(Power Management IC)从主机输入的 3.3V 转换出所有这些电压。 电源完整性是高速系统的隐形杀手——电源噪声直接耦合到信号通路, 影响 BER。高质量 PMIC + 精心的去耦设计,是 Cisco 等一线厂商光模块品质的基础之一。
高速 DSP 需要一个极其稳定的参考时钟,通常来自:
时钟的相位噪声直接决定了 DSP 的性能——特别是相干光对时钟抖动极其敏感。 这是另一个隐形但关键的工程细节。
光模块电芯片的演进清晰地走向"合并":
| 时代 | 电芯片组成 | 典型数量 |
|---|---|---|
| 2010 年(10G SFP+) | CDR + LA + Driver(分立) | 3–4 颗 |
| 2015 年(100G QSFP28) | DSP/CDR + Driver + TIA(分立) | 3 颗 |
| 2020 年(400G QSFP-DD) | DSP(集成 SerDes)+ Driver/TIA | 2 颗 |
| 2024 年(400G ZR) | DSP(集成 ADC/DAC/FEC) + 驱动/TIA | 2 颗 |
| 未来(CPO) | 光引擎与交换 ASIC 共封装 | 合并成 1 颗 |
LPO(Linear Pluggable Optics 线性可插拔光学) 是一条激进的简化路线: 去掉模块内的 DSP,让主机侧的 DSP 承担所有信号处理。 光模块只保留简单的线性放大器(Driver/TIA),信号"透明"通过。
LPO 的价值:
代价:距离较短(典型 500m–2km),对主机 DSP 要求高,互操作性弱化。 所以 LPO 主要用于 AI 集群内部短距高密度连接。
CPO(Co-Packaged Optics 共封装光学) 更进一步—— 光引擎直接与交换 ASIC 共封装,彻底消除可插拔连接器。
CPO 时代,DSP 的命运有三种可能:
这对整个光模块 DSP 产业链是一次重新洗牌。Cisco 作为既有交换 ASIC(Silicon One)、 又有 DSP(Acacia)、还有硅光子能力的"全能选手"——在 CPO 时代处于非常有利的位置。 这也正是 Cisco 收购 Acacia 战略意图的最终兑现。
本章是架构哲学的对决——两种技术栈的系统对比: 直检(强度调制,$400 BOM,<10km)vs 相干(振幅+相位+偏振,$1500 BOM,>100km)。 你将看到 14 维度组件级差异、BOM 成本拆解、应用场景分布图, 最终通过六维决策框架学会:在给定场景下该如何选择。 核心洞察:直检统治数据中心(85% 市场),相干统治长距传输。
经过前四章的解剖,我们已经分别深入理解了光模块的外壳、发射光路、接收光路、电芯片与 DSP。 现在要从架构哲学的高度,系统对比两类截然不同的光模块——直接检测 vs 相干光。 这不仅是技术对比,更是两种不同的工程哲学: 是追求"简单之美",还是追求"极致性能"? 是让光学简单而电子承担复杂度,还是让光学精密而电子相对简化? 这些哲学选择的背后,是对"什么是光通信最本质的使命"的不同回答。
核心思想:只用"光的强度"(On/Off 或多电平)携带信息。
设计理念:简单、便宜、低功耗、够用就好。
历史起源:1970 年代光通信诞生之初就是直接检测——半导体激光器发明人 Hayashi 在 1970 年点亮第一颗半导体激光器时,人们自然想到的就是"亮=1、暗=0"的直接方案。
典型产品:所有 SR、DR、FR、LR、ER 模块;100G/400G/800G 数据中心主流。
类比:莫尔斯电码——只用"点和划"两个符号传递信息。简单、可靠、易懂。
核心思想:利用光的完整属性——振幅 + 相位 + 偏振。
设计理念:不惜一切代价接近香农极限。
历史起源:相干光概念诞生于 1980 年代,但直到 2010 年前后硅光子 + 高性能 DSP 成熟,才实现工业化。2020 年起开始以可插拔形态(400ZR)走向主流。
典型产品:400G/800G ZR/ZR+、电信级长距 transponder、1.6T DCI 模块。
类比:高清电视广播——不仅传送"有画面/没画面",还传送每个像素的亮度、色彩、声音——信息维度最大化。
这两种哲学的核心分歧在于一个根本问题:光的哪些属性应该被用来传递信息?
结果就是两种截然不同的技术栈、成本结构、应用场景。让我们系统对比。
下面这张表,是本章最重要的参考——它把直接检测和相干光在每一个组件层面的差异全部呈现:
| 组件维度 | 直接检测模块 | 相干光模块 |
|---|---|---|
| 激光器类型 | DFB / EML / VCSEL,线宽 ~1–10 MHz | 窄线宽 ECL,线宽 < 100 kHz |
| 激光器数量 | 1–4 颗(对应 4 通道 Lambda) | 2 颗(信号 + LO) |
| 调制方式 | 直接调制(DML)或 EAM 吸收调制 | I/Q MZM(每偏振一对) |
| 调制器数量 | 0(DML)或 1–4(EAM) | 4 个 MZM + 偏振合束 |
| 调制格式 | OOK(1 bit/sym)/ PAM4(2 bit/sym) | DP-QPSK(4 bit/sym)/ DP-16QAM(8 bit/sym)/ DP-64QAM(12 bit/sym) |
| TEC 需求 | 长距需要,短距可省略 | 必需(信号激光器 + LO 激光器都要) |
| 光复用 | MPO 并行 或 CWDM 合波 | 单波长输出(DWDM 由外部 OLS 完成) |
| 光电探测器 | PIN 或 APD,1–4 颗 | 平衡探测器对 × 4 = 8 个 PD |
| 90° Hybrid | ❌ 不需要 | ✅ 必需(2 个,分别对应 X/Y 偏振) |
| 偏振分束器(PBS) | ❌ 不需要 | ✅ 必需 |
| ADC | NRZ 不需要;PAM4 用内嵌 slicer(低速) | 必需,4× 超高速 ADC(128 GSa/s) |
| DSP 复杂度 | 中等(~10 亿晶体管,7nm) | 极高(~50 亿晶体管,5/3nm) |
| FEC 类型 | KP4 / RS(544,514) HD-FEC,NCG ~6 dB | SD-FEC / oFEC,NCG ~11 dB |
| 典型功耗(400G) | 10–15W(DR4/FR4/LR4) | 15–20W(ZR/ZR+) |
| BOM 成本 | ~$200–400 | ~$1,300–1,500(3–5× 倍差) |
| 传输距离 | < 10–40 km | 120–3000 km+ |
| 典型应用 | 数据中心内外互联 | DCI / 城域 / 长距骨干 / 海底光缆 |
这张表浓缩了两种哲学在每一个技术维度的选择。最显著的差异是:
核心洞察:相干光用"更高的制造成本"换取了"更长的光纤距离"—— 这是一笔系统级的账:当你需要连接两个相距 80km 的数据中心时, 相干光模块虽然贵 $1000,但你省下了中间的光放大器、色散补偿器、甚至中继站—— 这笔账怎么算都划算。
直接检测走的是"尽量在光域做好,电域简单处理"的路线:
• PAM4 编码(简单映射)
• KP4 FEC(低开销、硬判决)
• 发射预加重(补偿电通道)
• 不做:预失真、PCS、复杂脉冲成形
• TIA + LA 模拟放大
• CDR 时钟恢复
• CTLE + DFE 均衡(补偿光通道损伤)
• KP4 FEC 解码
• 不做:色散补偿、MIMO、相位恢复
相干光走的是"光域只做必要的,主要靠电域 DSP 超级大脑"的路线:
• SD-FEC 编码(~20% 开销,NCG ~11dB)
• QAM 映射(16 个星座点)
• PCS 概率星座整形(香农极限逼近)
• 脉冲成形(RRC 滤波)
• 数字预失真(补偿 MZM 非线性)
• I/Q 分离(4 路独立信号)
• IQ 失衡校正
• 色散补偿(频域 FIR)
• 时钟恢复
• 偏振解复用(MIMO 2×2 + CMA)
• 频偏估计
• 载波相位恢复
• 非线性补偿(DBP)
• 软判决(LLR 计算)
• SD-FEC 迭代解码
哲学差异的根本:
直接检测就像传统胶片相机——靠精密光学(镜头、快门)捕捉完美画面,
胶片本身只是"记录介质"。光学做得好,后期几乎不需要处理。
相干光就像现代手机计算摄影——光学镜头可以相对简单,
但靠芯片的 AI 算法做 HDR、多帧合成、超分辨率——计算弥补了光学的局限。
最后拍出来的照片质量反而超越了传统相机。
这正是相干光的底层逻辑:用硅芯片摩尔定律的红利,换取光学器件的简化和系统性能的飞跃。
接收灵敏度是评估光模块接收性能的黄金指标。两种方案的差异巨大:
| 方案 | 典型模块 | 接收灵敏度 | 物理原因 | |
|---|---|---|---|---|
| 直检 PAM4(短距) | 400G DR4 | −6 dBm | 量化噪声 + TIA 热噪声主导 | |
| 直检 PAM4(中距) | 400G FR4 | −9 dBm | 同上 | |
| 直检 APD(长距) | 100G ER4 | −21 dBm | APD 雪崩增益提供 ~10 dB 优势 | |
| 相干 DP-QPSK | 100G ZR | −23 dBm | −10 dBm | LO 增益 + SD-FEC 双重加持 |
| 相干 DP-16QAM | 400G ZR | −20 dBm | 高阶调制对 SNR 要求较高 | |
| 相干 + EDFA(Bright) | 800G ZR+ | −24 dBm | 内置光放大 + SD-FEC |
相干光比直接检测 PAM4 高 7–15 dB 灵敏度——这是它能跑长距离的根本原因。
频谱效率(SE)= 比特率 ÷ 信号带宽,单位 bit/s/Hz。决定了同一根光纤能承载多少数据:
| 调制格式 | 频谱效率 | 比值 | 方案 |
|---|---|---|---|
| NRZ (OOK) | 1 bit/s/Hz | 1×(基准) | IM-DD 10G/25G |
| PAM4 | 2 bit/s/Hz | 2× | IM-DD 50G+ |
| DP-QPSK | 4 bit/s/Hz | 4× | 100G ZR |
| DP-16QAM | 8 bit/s/Hz | 8× | 400G ZR |
| DP-64QAM | 12 bit/s/Hz | 12× | 海底光缆 |
频谱效率是光纤容量的"乘数"——相干光 + 高阶 QAM 让同一根光纤能承载 4–12 倍数据量。 对于跨洋海底光缆(铺设成本数亿美元),频谱效率每提升 1 倍,就意味着基础设施价值翻倍—— 这是为什么海缆必须用相干光 64QAM 的经济学。
这是直接检测和相干光性能差距最悬殊的维度:
• 色散容限:25G PAM4 约 1000 ps/nm
• 对应单模光纤长度:~60 km
• 解决:DCF 色散补偿光纤(贵、有损、复杂)
• 本质:直检丢失了相位信息,色散导致的脉冲展宽不可逆
• 色散容限:> 100,000 ps/nm
• 对应光纤长度:> 6000 km
• 解决:DSP 频域 FIR 滤波(基本"免费")
• 本质:相干保留相位信息,色散可被数字域反转
100 倍的色散容限差距——这一个指标就决定了相干光是跨洋海缆的唯一选择。 没有相干光,没有今天的全球互联网。
让我们对比两款同速率模块(400G DR4 直检 vs 400G ZR 相干)的 BOM 成本拆解—— 这是理解"为什么相干光贵"的关键。
图5-1:400G DR4 vs 400G ZR BOM 成本拆解对比
相干光成本每代下降 30–40%。400G ZR 从 2020 年推出时的 ~$3000+,到 2024 年已降到 ~$1500 左右。 根据 Cignal AI 的数据,2024 年相干光模块在相干端口总量中占比已超过 50%——可插拔相干光正在成为主流。
当 800G ZR+ 成本下降后,相干光将进一步渗透到中距应用(10-40km), 甚至开始挑战传统直检的领地——这就是下面要谈的"相干下沉"趋势。
图5-2:直检与相干光在"距离维度"上的应用分布与演进趋势
10–40 km 距离是最激烈的战场:
简化版相干光是近年最热的方向之一。核心思路:
代表方案:100ZR(Cisco QSFP28 100G ZR)——用 QSFP28 这种"直检封装"做相干光, 功耗 ≤ 6W,成本已经接近高端直检模块,但距离达 140 km。这是相干光"向下攻击"的利器。
直检阵营也在演进:
这些技术让直检的"天花板"持续上移。但由于 SNR 的物理限制, 直检不可能达到相干的频谱效率——PAM8 的 3 bit/s/Hz vs DP-64QAM 的 12 bit/s/Hz,差距仍然是 4 倍。
随着 AI 集群规模爆炸性增长,数据中心之间的链路(Scale-Across)需求激增。 Cisco 的 BRKOPT-2699 技术文档明确指出:
"AI 数据中心对长距光纤的需求正在爆炸式增长。当一个 AI 训练任务跨越多个数据中心, 对低延迟、高带宽、高可靠的长距互联需求是前所未有的。 相干光正在从电信领域走向数据中心——这是产业最大的趋势之一。"
最终,两种哲学可能会融合:
作为系统设计者或采购决策者,你将面对"直检 vs 相干"的选择。下面是一个可操作的决策框架:
图5-3:直检 vs 相干光的工程选型决策树
本章从产业大地回望全局:光模块如何从三级制造体系(光芯片→TOSA/ROSA→整机) 走向成品;Cisco Avalanche 测试如何解决多厂商兼容性痛点; 未来十年的速率路线图(1.6T→3.2T→6.4T)与 CPO/LPO 革命将如何重塑产业;以及中国厂商三级跳 的崛起逻辑与上游短板。这是"理解技术"到"理解产业"的升华一章。
经过前五章,我们已经从最微观的物理原理(光电效应、干涉、调制)一路爬升到最抽象的哲学对决(直检 vs 相干)。
现在,是时候回到产业大地——从宏观视角回答几个关键问题:
这些精妙的光模块究竟是怎样被"造"出来的?如何保证它们的质量?产业链由谁掌控?
未来的 10 年,光模块将如何演进?中国厂商如何在这个领域异军突起?
这一章将帮助你从"理解技术"升华到"理解产业"——从工程师视角升华到产业观察者视角。
光模块的制造是一个跨学科、跨工艺、跨产业链的协同工程。它涉及三个层次:
图6-1:光模块制造的三级体系
在所有制造工艺中,光学耦合是最考验工程功力的环节。让我们理解这个挑战的本质:
想象你站在 100 米外,要把一颗乒乓球准确丢进一个 9 毫米的洞——
这就是光学耦合的难度。而且你要在 30 秒内完成,还要连续做几千次不出错。
光模块产线上,每一颗激光器都需要有源对准(Active Alignment)——
给激光器加电让它发光,实时监测耦合功率,机械手以亚微米分辨率移动光纤位置,
找到最佳耦合点后立即用激光焊接固定——整个过程几秒钟完成。
这是光模块产业最精密的自动化制造工艺之一。
硅光子工艺的巨大价值在于——它用波导代替了空间光路, 可以在晶圆上用光刻定义的精度(< 100 nm)实现对准,几乎不需要主动调整。 这是硅光子能大规模降低成本的核心原因之一。
| 环节 | 国际领先者 | 中国领先者 | 产业集中度 |
|---|---|---|---|
| 激光器芯片 | Lumentum、Coherent(II-VI)、Broadcom、Mitsubishi | 光迅、源杰、长光华芯、博创 | 高(前 5 占 80%+) |
| 硅光子芯片 | Cisco/Acacia、Intel、Rockley、Ayar Labs | 中芯国际(代工)、博创、海光 | 极高(前 3 占 70%+) |
| DSP ASIC | Cisco/Acacia、Marvell、Broadcom | (自研稀缺,主要依赖国际供应) | 极高(前 3 占 90%+) |
| 光模块整机 | Coherent/II-VI(含原 Finisar)、Cisco、Nokia、Ciena | 中际旭创、新易盛、光迅、华工正源、海信宽带 | 中等(前 10 占 60%) |
重要观察:中国厂商在"光模块整机"环节已经占据全球过半市场份额 (特别是数据中心直检模块),但在上游的"光芯片"和"DSP"环节仍然相对落后。 这是下一个十年中国产业链升级的关键战场。
• 眼图:信号质量的黄金指标
• TDECQ:PAM4 眼图闭合惩罚(IEEE 规范 < 3.4 dB)
• 抖动(Jitter):随机 + 确定性
• BER:< 1e-12(NRZ)或 pre-FEC < 2.4e-4(PAM4)
• 波长 + SMSR:边模抑制比
• Tx 平均功率:标定值与稳定性
• 消光比(ER):亮暗差异
• RIN:相对强度噪声
• 线宽(相干光关键)
• 接收灵敏度:BER vs Rx 功率曲线
• 色散容限:加入色散源后的性能
• 长时间稳定性:数小时 BER 跟踪
• 温度循环下性能
• 温度循环:商温 0–70°C,工业 −40°C–+85°C
• 湿度:85°C/85%RH(HAST)
• 振动/冲击
• Burn-in 老化:85°C 连续 168+ 小时
在众多光模块测试体系中,Cisco 的 Avalanche 测试系统值得特别关注—— 它解决了一个业界长期痛点:光模块与第三方交换机/路由器的兼容性问题。
数据中心光模块的典型要求:
阈值电流上升、输出功率下降(~1%/年)。符合 Arrhenius 方程——温度每升 10°C,寿命减半。
端面灰尘、水汽凝结。一粒亚微米尘埃就可能让链路失效。
高速电路对 ESD 极其敏感。运维时必须防静电手环。
温度循环 10,000+ 次后焊点可能出现裂纹。特别是 BGA 焊点。
Cisco 的白皮书《The Critical Role of High-Quality Optics in AI Networks》提出一个重要概念: AI 网络对光模块可靠性的要求比传统数据中心更苛刻。
为什么?三个关键原因:
这就是为什么 Cisco 强调"link flap 不是传统可靠性指标,但在 AI 场景是关键痛点"—— MTBF 可能没变,但 link flap 的影响被放大了上百倍。高质量光模块的价值在 AI 时代被前所未有地凸显。
• 全球光模块市场:~$150 亿
• 数据中心占比:~50%+
• 电信网络占比:~30%
• 企业/接入占比:~20%
• 2030 年 AI 光模块 TAM > $200 亿/年
• 前端网络 + 后端(Scale-Out/Across)网络双爆发
• 速率快速迭代:400G → 800G → 1.6T → 3.2T
• LightCounting 预测 AI 光模块将主导未来 5 年增长
| 产品档次 | 毛利率 | 护城河 |
|---|---|---|
| 低端 SFP+/SFP28 | < 20% | 薄(纯成本竞争) |
| 主流 QSFP28/QSFP-DD | 20–35% | 中(需要一定规模) |
| 高端相干 400G ZR/ZR+ | 40%+ | 深(DSP + 硅光技术壁垒) |
| 前沿 1.6T / CPO | 50%+ | 极深(全栈能力要求) |
图6-2:光模块速率演进——AI 时代的加速曲线
光引擎直接封装在交换 ASIC 旁边(同一块基板/package 上),不再是可插拔。 消除长距电信号传输,极大提高带宽密度,降低总功耗。这是 102.4T 及以上交换芯片时代的必然选择。
为什么需要 CPO?当交换 ASIC 达到 102.4T(甚至 204.8T),传统可插拔光模块面临三重绝境:
CPO 的价值:
CPO 的挑战:
LPO 是一条与 CPO 并行的简化路线:去掉光模块内的 DSP,依赖主机 DSP 的能力。 根据 Cisco 的产品资料:
LPO vs CPO:两者都是能效优化的探索,但 CPO 更激进(完全集成),LPO 更渐进(保留可插拔)。 两者会在不同场景共存——LPO 适合 AI 集群内部 500m–2km 的短距高密度场景,CPO 面向 102.4T+ 的超高端场景。
根据 LightCounting 预测,到 2030 年 AI 集群中 80%+ 的光模块将基于硅光子技术。 硅光子的决胜点在于:
未来的光模块将集成 AI 能力:
Cisco 的 VDM(Versatile Diagnostics Monitoring)已经迈出了这一步—— 光模块成为"会思考的网络传感器"。
• 完整产业链配套(PCB、SMT、光学封装、测试)
• 工程师红利(光电专业毕业生数量)
• 产能弹性(快速扩产能力)
• 超大规模云厂商(阿里、腾讯、字节)的内需拉动
• 成本控制能力
• 相干光 DSP——几乎完全依赖 Cisco/Acacia、Marvell
• 高端可调谐激光器——依赖 Lumentum、Coherent
• 先进工艺 CMOS——5nm/3nm 代工受限
• EDA 工具——Synopsys、Cadence 等美系垄断
中国光模块产业的演进给我们带来几条深刻启示:
前面我们讲了中国厂商的崛起。但在产业链的顶端,Cisco 通过垂直整合打造了一套独特的"技术→商业价值"转化链—— 不是靠单点技术,而是靠多项协同。这张全景卡让你直观理解:Cisco 的每一项技术投入, 最终如何变成客户愿意付出 30% 溢价的商业理由。
💎 核心洞察:这七项差异化不是"互相独立的特性",而是一个协同体系—— VDM 数据 + Avalanche 测试 + 固件升级 共同构成了 Cisco 光模块"高可靠性"的承诺; 垂直整合 + OpenZR+ + LPO/CPO 布局 构成了未来 AI 时代的技术护城河。 这就是为什么 ACG Research 的研究指出,采用 Cisco Routed Optical Networking 架构的客户可实现 46% TCO 降低 / 35% CapEx 降低 / 57% OpEx 降低—— 这是技术到商业价值最直接的转化证据。
如果本专题激发了你进入光通信领域的兴趣,可以考虑以下方向:
半导体物理、外延工艺、器件设计。博士门槛高、回报高。适合热爱基础物理和材料的读者。
硅光 PIC 设计、电光协同仿真。新兴方向,需求爆发。适合喜欢跨学科(光/电/工艺)的读者。
相干 DSP、FEC、信号处理。顶级数学和算法能力。全球玩家稀少,薪酬顶级。
光模块系统集成、测试、验证。需要全栈理解光电系统。门槛适中、需求广泛。
客户支持、方案设计、现场调试。适合喜欢"理论 + 沟通"的读者。
市场研究、竞争分析、投资。适合既懂技术又擅长商业思考的读者。
本专题涉及的关键量化指标全部汇总于此。无论你是学习复盘、汇报引用,还是采购决策, 都可以在这里快速检索到最核心的"数字锚点"。所有数据均为典型工业值,具体产品需参考厂商规格。
经过六个子模块、六万余字的深度旅程,我们已经把一颗火柴盒大小的光模块——彻底解剖了。 现在让我们站到制高点,回望这一路看到的风景,绘制属于你自己的"光模块世界地图"。
从第 1 章的外壳尺寸,到第 6 章的产业格局;
从激光器的量子跃迁,到 DSP 的50 亿晶体管;
从 MZM 的干涉数学,到海缆的60,000 公里光纤——
我们看到了一个惊人的事实:一颗光模块不是一个"器件",而是一个浓缩的世界。
它是半导体物理、光学、数字信号处理、CMOS 工艺、精密封装、信息理论、产业经济学
共同孕育的结晶。
更深刻的是,每一代光模块的进步都承载着人类通信能力的跃升——
从 1G SFP 到 1.6T OSFP,数据率提升了 1600 倍。
没有这种进步,就没有今天的互联网、云计算、AI 时代、乃至元宇宙。
光模块是数字文明的"血管",默默无闻却不可或缺。
"我们解剖的,从来不是一颗光模块。
我们解剖的,是人类如何把 电子跳跃 变成 光的脉动,
如何让信息跨越海洋,
如何在 7.8 皮秒内做出无数次精密决策。
这是物理、数学、工程、产业四维交织的一场持续百年的伟大协作。"
感谢你陪我走完这 6 万字的旅程。愿你今后每一次握起一颗光模块——
都能看见那里面整个数字文明的倒影。
本专题涉及的所有关键术语的中英文对照与简要解释。按字母/拼音排序,方便查阅。
| 缩写 | 英文全称 | 中文 | 简述 |
|---|---|---|---|
| ADC | Analog-to-Digital Converter | 模数转换器 | 模拟电压→数字样本;相干光需 128 GSa/s+ |
| APC | Angled Physical Contact / Auto Power Control | 斜角接触 / 自动功率控制 | 连接器 8°斜角抛光;激光器输出功率闭环控制 |
| APD | Avalanche Photodiode | 雪崩光电二极管 | 内部雪崩倍增,灵敏度高 10dB+ |
| ASIC | Application-Specific Integrated Circuit | 专用集成电路 | 为特定功能定制的芯片 |
| BER | Bit Error Rate | 误码率 | 传输错误概率,通常 <1e-12 |
| BPD | Balanced Photodetector | 平衡光电探测器 | 两个匹配 PD 差分探测,消除共模噪声 |
| CDR | Clock and Data Recovery | 时钟数据恢复 | 从数据信号中提取时钟、重判数据 |
| CMIS | Common Management Interface Specification | 光模块通用管理规范 | OIF 制定的统一管理接口 |
| CMOS | Complementary Metal-Oxide-Semiconductor | 互补金属氧化物半导体 | 主流 IC 工艺,5nm/3nm 节点 |
| CPO | Co-Packaged Optics | 共封装光学 | 光引擎与交换 ASIC 同封装 |
| CWDM | Coarse Wavelength Division Multiplexing | 粗波分复用 | 波长间距 20nm 的 WDM |
| DAC | Digital-to-Analog Converter | 数模转换器 | 数字样本→模拟电压 |
| DBR | Distributed Bragg Reflector | 分布布拉格反射镜 | 半导体周期结构反射镜 |
| DDM/DOM | Digital Diagnostic Monitoring | 数字诊断监测 | 光模块实时参数监测(温度、功率、电流) |
| DFB | Distributed Feedback Laser | 分布反馈激光器 | 窄线宽单纵模激光器,中长距主流 |
| DML | Directly Modulated Laser | 直接调制激光器 | 直接调制激光器电流实现数据调制 |
| DP-QAM | Dual-Polarization QAM | 双偏振正交幅度调制 | 相干光偏振复用调制 |
| DSP | Digital Signal Processor | 数字信号处理器 | 光模块的"大脑",执行色散补偿、FEC 等 |
| DWDM | Dense Wavelength Division Multiplexing | 密集波分复用 | 波长间距 50/100 GHz 的 WDM |
| EAM | Electro-Absorption Modulator | 电吸收调制器 | 基于 QCSE 的半导体调制器 |
| ECL | External Cavity Laser | 外腔激光器 | 超窄线宽激光器,相干光 LO 主流 |
| EDFA | Erbium-Doped Fiber Amplifier | 掺铒光纤放大器 | C 波段光放大器 |
| EML | Externally Modulated Laser | 外部调制激光器 | DFB + EAM 集成,零啁啾 |
| ENOB | Effective Number of Bits | 有效位数 | ADC 真实分辨率 |
| FEC | Forward Error Correction | 前向纠错 | 冗余编码纠错,HD/SD 两种 |
| FIR | Finite Impulse Response | 有限脉冲响应 | 数字滤波器类型,用于色散补偿 |
| FR4 / DR4 / LR4 | Far Reach / Direct Reach / Long Reach 4-lane | 中距/短距/长距 4 通道 | IEEE 以太网光接口距离分类 |
| ITU-T | International Telecommunication Union - Telecom | 国际电联电信标准部 | 制定 DWDM、OTN 电信标准 |
| IEEE | Institute of Electrical and Electronics Engineers | 电气电子工程师学会 | 制定 802.3 以太网标准 |
| IM-DD | Intensity Modulation Direct Detection | 强度调制直接检测 | 传统光通信方案 |
| LDPC | Low-Density Parity-Check | 低密度奇偶校验码 | SD-FEC 常用编码 |
| LO | Local Oscillator | 本振激光器 | 相干接收参考光 |
| LPO | Linear Pluggable Optics | 线性可插拔光学 | 无 DSP 的简化可插拔模块 |
| LTP | Level Transition Parameter | 电平跳变参数 | PAM4 信号完整性指标 |
| MCU | Microcontroller Unit | 微控制器 | 光模块管理软件运行载体 |
| MIMO | Multiple-Input Multiple-Output | 多输入多输出 | 偏振解复用用 2×2 MIMO 均衡 |
| MPO | Multi-fiber Push-On | 多芯推入式连接器 | 8/12/16/24 芯并行光连接器 |
| MSA | Multi-Source Agreement | 多源协议 | 多厂商协同的机械电气规范 |
| MTBF | Mean Time Between Failures | 平均故障间隔时间 | 可靠性指标,典型 10 万+ 小时 |
| MZM | Mach-Zehnder Modulator | 马赫-曾德尔调制器 | 干涉式外部调制器,相干光核心 |
| NCG | Net Coding Gain | 净编码增益 | FEC 的核心指标,SD-FEC ~11 dB |
| NRZ | Non-Return-to-Zero | 不归零码 | 二电平调制,1 bit/symbol |
| OIF | Optical Internetworking Forum | 光互连论坛 | 制定电接口、相干光接口规范 |
| OLS | Open Line System | 开放线路系统 | DWDM 光传输线路(如 Cisco NCS 1010) |
| OOK | On-Off Keying | 开关键控 | 最简单的强度调制 |
| OSFP | Octal Small Form-factor Pluggable | 8 通道小型可插拔 | 400G/800G/1.6T 封装主流 |
| OTN | Optical Transport Network | 光传输网 | ITU-T 定义的光传输帧结构 |
| PAM4 | 4-level Pulse Amplitude Modulation | 4 电平脉冲幅度调制 | 2 bit/symbol 强度调制 |
| PBS/PBC | Polarization Beam Splitter/Combiner | 偏振分束器/合束器 | 分离或合并两个偏振态 |
| PCS | Probabilistic Constellation Shaping | 概率星座整形 | 接近香农极限的调制优化 |
| PD | Photodetector / Photodiode | 光电探测器 | PIN / APD 将光转换为电流 |
| PIC | Photonic Integrated Circuit | 光子集成电路 | 硅光子芯片 |
| PIN | P-Intrinsic-N photodiode | PIN 光电二极管 | 主流光电探测器 |
| PMD | Polarization Mode Dispersion | 偏振模色散 | 相干光通过 DSP 补偿 |
| PMIC | Power Management IC | 电源管理芯片 | 多路电压转换 |
| QAM | Quadrature Amplitude Modulation | 正交幅度调制 | 16/64QAM 为相干光主流 |
| QCSE | Quantum-Confined Stark Effect | 量子限制斯塔克效应 | EAM 工作原理 |
| QPSK | Quadrature Phase Shift Keying | 正交相位键控 | 2 bit/symbol 相位调制 |
| QSFP-DD | Quad SFP Double Density | 双密度 QSFP | 400G/800G 数据中心主流封装 |
| RIN | Relative Intensity Noise | 相对强度噪声 | 激光器强度噪声指标 |
| ROSA | Receiver Optical Sub-Assembly | 接收光学组件 | PD + TIA + 光纤耦合 |
| SerDes | Serializer/Deserializer | 串行/解串器 | 高速电接口收发 |
| SD-FEC | Soft-Decision FEC | 软判决 FEC | 利用软信息解码,NCG ~11 dB |
| SFP | Small Form-factor Pluggable | 小型可插拔封装 | 1G/10G/25G/50G 主流封装 |
| SMF / MMF | Single / Multi Mode Fiber | 单/多模光纤 | 9μm / 50μm 纤芯直径 |
| SMSR | Side-Mode Suppression Ratio | 边模抑制比 | 单纵模激光器指标 |
| SNR | Signal-to-Noise Ratio | 信噪比 | 通信系统核心指标 |
| TDECQ | Transmitter Dispersion Eye Closure Quaternary | 发射端色散眼图闭合 | PAM4 发射信号质量指标 |
| TEC | Thermoelectric Cooler | 半导体制冷器 | 激光器温度控制 |
| TIA | Transimpedance Amplifier | 跨阻放大器 | PD 输出电流放大为电压 |
| TOSA | Transmitter Optical Sub-Assembly | 发射光学组件 | 激光器 + 调制器 + 耦合 |
| VCSEL | Vertical-Cavity Surface-Emitting Laser | 垂直腔面发射激光器 | 850nm 多模短距主流激光器 |
| VDM | Versatile Diagnostics Monitoring | 多功能诊断监测 | Cisco 光模块高级遥测能力 |
| WDM | Wavelength Division Multiplexing | 波分复用 | 多波长共享一根光纤 |
| ZR / ZR+ | Zero Reach / Zero Reach Plus | 零接触(长距相干) | 可插拔相干光模块,80–120km+ |
本专题继承前 9 模块的光通信系统知识,聚焦光模块这一"火柴盒大小的工程奇迹", 从封装外壳一路深入到 50 亿晶体管的相干 DSP,从硅光子晶圆到 AI 集群的 Scale-Across—— 我们共同走过了 6 个子模块、约 6.8 万字、数十张 SVG 图解的深度旅程。
感谢 Cisco / Acacia 的技术资料、白皮书、BRKOPT-2699 等公开技术文档为本专题提供的丰富原材料。
本专题旨在教育与研究目的,不构成任何投资或采购建议。
✦ 愿你在光的世界里,继续保持解剖的好奇心 ✦