Optical 101 · 技术深度博客

光通信基础
从光子到比特的旅程

从第一性原理出发,以苏格拉底式追问驱动思考——
系统探索光的本质、光纤传输与调制解调的核心逻辑。
三个模块,带你建立光通信的底层认知框架。

阅读约 30 分钟 3 个模块 · 17+ 公式 · 20+ 核心要点 2026 年 4 月
TL;DR · 三句话读懂这篇文章
01
为什么用光?
光的频率 200 THz,比无线电波高 5–8 个数量级——这意味着可用带宽呈指数级扩大。香农公式告诉我们,带宽越大,信道容量越大。

注:严格来说,通信容量取决于“可用带宽”,而非载波频率本身。光的高频率意味着可以划分出更宽的可用频谱窗口。

02
为什么用玻璃纤维?
利用全内反射,一根比头发丝还细的玻璃丝能把光"关"在里面跑 上千公里。现代单模光纤的衰减低至 0.17 dB/km,接近物理极限。 (该极限主要由瑞利散射决定,与材料的微观密度涨落相关)
03
为什么现代模块这么快?
通过同时调制光的振幅、相位、偏振三个维度(如 DP-16QAM),加上相干检测 + DSP + SD-FEC,单波长可达 800G/1.6T
🧠 一个模型记住整篇文章
  • 物理层: 光是高频电磁波 → 决定潜在带宽
  • 介质层: 光纤低损耗窗口 → 决定传输距离
  • 信息层: Shannon 极限 → 决定最大容量
  • 工程层: 调制 + DSP → 逼近极限
Module 01 of 03

光与信息的基础

一切从「为什么用光来传输信息?」这个最根本的问题开始。我们将回到麦克斯韦方程、香农信息论,从第一性原理理解光作为信息载体的独特优势。

如果要把一条消息传递到 10,000 公里之外——比如从东京到纽约——你会选择什么方式?电信号?无线电波?光?为什么?

提示:想想哪种方式能同时满足「快」「多」「远」三个需求。

这是整个光通信大厦的地基问题。在展开任何技术细节之前,我们必须先理解两件事:光到底是什么,以及信息到底是什么。只有当这两个概念在你脑中清晰了,后面的光纤、调制、DWDM 才会像乐高积木一样自然地搭建起来。

1.1 光的本质:从麦克斯韦到波粒二象性

Why — 为什么要从光的本质开始?

因为光通信的一切优势——超大带宽、超低损耗、抗电磁干扰——都不是工程师凭空设计出来的,而是光的物理本质所决定的。如果不理解光为什么有这些特性,你就只能死记参数,而无法在面对新技术时做出独立判断。

What — 光是电磁波

1865 年,麦克斯韦完成了物理学史上最伟大的统一之一:他用四个方程将电场和磁场统一了起来,并且预言了电磁波的存在。更令人震惊的是,他计算出电磁波在真空中的传播速度恰好等于已测定的光速——于是他大胆宣称:光就是电磁波

核心公式 ①:电磁波速度
c = 1 / √(μ₀ε₀) ≈ 3 × 10⁸ m/s
μ₀ = 真空磁导率,ε₀ = 真空介电常数。这个常数不依赖于任何波源的性质——它是时空本身的属性。
类比:池塘里的涟漪

把一颗石子扔进平静的池塘,水面会形成同心圆的波纹向外扩散。电磁波的传播类似——只不过「扰动」的不是水面,而是电场和磁场。电场的变化激发磁场,磁场的变化又反过来激发电场,两者互相推动,像两个人交替跑接力赛一样,把能量传递到远方,而且根本不需要介质。

所有的电磁波——无线电波、微波、红外线、可见光、紫外线、X射线、伽马射线——本质上都是同一种东西,区别只在于频率(或等价地说,波长)。

核心公式 ②:波长-频率关系
c = λ × f
λ(lambda)= 波长(m),f = 频率(Hz)。波长越短,频率越高,单个光子携带的能量越大。
无线电波 微波 红外线 可见光 紫外线 X 射线 γ 射线 10³ m 10⁻² m 10⁻⁵ m ~500 nm 10⁻⁸ m 10⁻¹⁰ m 10⁻¹² m 光通信波段 1260 nm – 1625 nm (近红外) 频率 → 高 | 波长 → 短

图 1-1:电磁波谱全景。光通信使用的近红外波段位于可见光与红外线之间。

光通信并没有使用我们肉眼能看到的可见光(约 380–780 nm),而是选择了近红外区域(约 1260–1625 nm)。为什么?这个问题的答案藏在光纤的材料特性中——我们将在模块二详细揭晓。

How — 光的波粒二象性

光还有另一面:量子性。1905 年,爱因斯坦提出光不仅是波,还是一个一个的能量包——光子(photon)。每个光子的能量由频率决定:

核心公式 ③:光子能量
E = h × f = h × c / λ
h = 6.626 × 10⁻³⁴ J·s(普朗克常数)。1550 nm 光子的能量约 0.8 eV —— 极其微小,这正是光纤通信低功耗的物理基础之一。
类比:海浪与水滴

想象你站在海边:远观大海,你看到的是连绵的波浪(波动性);蹲下来细看,你会发现每一朵浪花都是由无数离散的水滴组成的(粒子性)。光也是一样——宏观上它呈现波动行为(干涉、衍射),微观上它以一个个光子的方式被发射和吸收。光通信系统的发射端(激光器)利用的是受激辐射——一种量子行为;传输过程(光纤)用的是经典波动光学;接收端(光电探测器)又回到了光子的粒子性——光电效应。

既然所有电磁波的速度都一样(光速),为什么我们选择光(近红外),而不用无线电波来做长距离大容量通信呢?

提示:想想频率差异意味着什么——可用带宽有多大?

答案的核心在于:光的频率约为 200 THz(10¹⁴ Hz),比无线电波(10⁶ – 10⁹ Hz)高出五到八个数量级。根据通信理论,载波频率越高,可供调制的带宽就越大,能承载的信息量就越多。这就像一条八车道的高速公路比一条乡间小路能运载更多车辆一样。这是光通信最根本的物理优势。

1.2 黄金波段:为什么是 1310 nm 和 1550 nm?

Why — 不是所有光都适合通信

虽然理论上任何频率的光都可以携带信息,但实际工程中,光纤材料(二氧化硅 SiO₂)对不同波长的光有不同的吸收和散射特性。就像不同频率的声音在水下传播衰减不同一样,光在光纤中也有「衰减曲线」。

5.0 4.0 3.0 2.0 1.0 0.5 0 衰减 (dB/km) OH⁻ 吸收峰 O-band 1310 nm ~0.35 dB/km C-band 1550 nm ~0.20 dB/km 800 1000 1200 1400 1600 1700 波长 (nm)

图 1-2:标准单模光纤 (G.652) 衰减随波长的变化曲线。1310 nm 和 1550 nm 附近是两个关键的低损耗窗口。

What — 两个黄金窗口

经过数十年的材料科学和制造工艺优化,光纤在两个波长区域达到了最低衰减:

波段名称 中心波长 典型衰减 色散特性 主要应用
O-band 1310 nm ~0.35 dB/km 零色散附近 短距/企业网、数据中心互联
C-band 1550 nm ~0.20 dB/km 有色散(可管理) 长途骨干网、海缆、DWDM 系统

1550 nm(C-band)之所以成为长距离通信的绝对主力,原因是双重的:它不仅衰减最低,而且恰好处于掺铒光纤放大器(EDFA)的增益窗口——这意味着信号在传输过程中可以被光学放大而无需转换为电信号。这个巧合般的物理事实,彻底改变了全球通信网络的架构。

类比:选择最佳飞行高度

飞机在不同高度飞行时,空气阻力和燃油效率都不同。民航客机选择在 10,000 米左右巡航,因为那个高度是「阻力最小、效率最高」的甜蜜点。光通信选择 1550 nm 也是同样的道理——那是光在二氧化硅光纤中「阻力最小」的波长。

💡 物理奇迹:EDFA 是如何“全光放大”的?

在 EDFA 发明前,光信号每跑几十公里,就必须先变成电信号、放大、再重新用激光器发光(O-E-O 转换),成本极其高昂。EDFA 打破了这个规则。

类比:水上滑板的接力推手。想象信号光子是失去速度的滑板选手。我们在光纤中掺入“铒 (Er) ”离子,并用一束 980 nm 的高能“泵浦光”照射它们,把铒离子激发到高能态(就像给沿途的推手喂饱了能量)。当疲惫的 1550 nm 信号光子经过时,会触发“受激辐射”——高能态的铒离子瞬间释放能量,产生一个与原光子频率、相位、方向完全相同的新光子。一个光子进去,两个光子出来;两个变四个... 信号就这样在纯光域被完美放大了!

🚀 2026 工业界前沿:从 C 波段向 C+L 波段的扩展

随着全球 AI 与数据流量的爆炸,即使在 C 波段逼近了香农极限,单根光纤的容量仍面临“枯竭”。因此,现代光传输系统已全面向右扩展,启用 L 波段(Long-wavelength Band, 1565–1625 nm)。C+L 双波段系统将可用频谱从约 4.8 THz 扩展到了近 10 THz,直接让光纤的传输容量翻倍。这就像在已经满载的 8 车道高速公路旁,利用现有的地基,硬生生又开辟出了全新的 8 车道。

1.3 信息论基础:香农告诉我们什么
关键过渡:从“能量”到“信息”

到目前为止,我们讨论的都是“光如何传播能量”。但通信的本质并不是传能量,而是传“差异”。 两束完全一样的光,无法携带任何信息;只有当光发生变化(强度、相位、频率),它才开始承载信息。 因此,我们需要一个新的理论来回答:“变化如何被量化为信息?”——这就是信息论的角色。

一根光纤能传多少信息?有没有一个理论上的极限?如果有,是什么决定了这个极限?

提示:答案不只与光纤有关——还与信号、噪声和带宽有关。

Why — 为什么需要信息论?

光通信不仅仅是物理学——它是物理学与信息科学的交叉。1948 年,克劳德·香农(Claude Shannon)发表了划时代的论文《通信的数学理论》,为所有通信系统定义了一个不可逾越的理论上限。理解香农极限,就是理解「光通信为什么还在持续进化」的根本原因。

What — 先回答:什么是"信息"?

在展开香农公式之前,我们必须先回答一个哲学式的问题:信息到底是什么?香农给出了一个优雅到令人震惊的答案——信息是"消除不确定性"的度量

如果一件事你完全确定会发生(例如"明天太阳会升起"),你从这个消息里得到的信息量是 0;如果一件事极其意外(例如"明天下午3点下红雪"),你得到的信息量就很大。越不可能的事件发生,信息量越大——这个直觉被香农用数学精确化了:

信息量(自信息)
I(x) = −log₂ p(x)   (单位:bit)
p(x) 是事件 x 发生的概率。为什么用 log₂?因为我们想让"两个独立事件的信息量可以相加"——乘法变加法,这是对数的本质。

对整个概率分布求加权平均,就得到香农熵(Shannon Entropy)——衡量一个随机变量"平均信息量"的最核心指标:

核心公式 ④′:香农熵
H(X) = −Σᵢ p(xᵢ) · log₂ p(xᵢ)   (bit/symbol)
H 越大,意味着这个信号源"越不可预测"、信息量越丰富。通信系统的根本任务就是把 H 个比特从 A 点高效搬到 B 点。
📊 三个直观例子,秒懂熵
场景 概率分布 熵 H(X) 直觉
公平硬币 P(正)=P(反)=0.5 1 bit 最不可预测
作弊硬币 P(正)=0.9, P(反)=0.1 ≈ 0.47 bit 几乎知道结果
公平六面骰子 每面 1/6 ≈ 2.585 bit log₂6,不是整数
双偏振 16QAM 符号 256 个符号,等概率 8 bit 正好是 log₂256

这张表里的最后一行揭示了一个重要洞察:当所有符号等概率出现时,熵达到最大值 log₂(N)——这是 DP-16QAM 每符号 8 bits 的数学来源。但你也许会问:"能不能让符号不等概率,反而更接近信道极限?" ——能!这就是模块三 §3.4.5 要介绍的 PCS 概率星座整形

类比:20 个问题猜物品

玩过"20 questions"游戏吗?每问一个是/否问题,相当于获得 1 bit 信息。根据信息论,最优策略是每次都问能把剩余可能性"对半砍"的问题——这样 20 bits 就能区分 2²⁰ ≈ 100 万个物品。光通信做的事情本质上完全一样:用尽可能少的光功率 × 带宽,传递尽可能多的"问题答案"。

Now — 香农信道容量公式

核心公式 ④:香农信道容量
C = B × log₂(1 + SNR)
C = 信道容量(bit/s),B = 带宽(Hz),SNR = 信噪比(线性值)。
这个公式告诉我们:要提升传输速率,你只有三条路——增大带宽、提高信噪比、或者两者同时进行。

让我们拆解这个公式的每一项,理解它对光通信的深远意义:

📡
B — 带宽
光的频率约 200 THz,理论可用带宽巨大。DWDM 技术通过同时使用多个波长来并行利用这个带宽。
📊
SNR — 信噪比
更好的激光器、更灵敏的探测器、更强的 EDFA 放大器,都是在提升 SNR。高阶调制格式(如 64QAM)对 SNR 要求极高。
🧮
log₂ — 对数关系
SNR 翻倍只能增加 1 bit/s/Hz 的频谱效率。这意味着单纯提高功率回报递减——我们必须「更聪明地使用每一赫兹」。
关键问题:噪声从哪里来?

在理想世界中,信号可以无限精确。但在现实中,任何通信系统都不可避免地受到噪声影响。 在光通信中,主要噪声来源包括:

  • 放大器噪声(ASE,来自 EDFA)
  • 光子本身的量子噪声(Shot Noise)
  • 光纤非线性引入的噪声(Kerr 效应)

香农公式中的 SNR,本质上就是“你能否区分信号与这些噪声”。

类比:高速公路的通行能力

把带宽 B 想象成高速公路的车道数,把 SNR 想象成每条车道上允许的最高车速。香农公式告诉你:这条公路每小时最多能通过多少辆车。你可以加车道(增大带宽),也可以提高限速(提高 SNR),但道路有物理极限(非线性效应、量子噪声),不可能无限扩展。光通信过去 40 年的进化史,就是不断逼近这条公路极限的故事。

How — 光如何携带信息?

理解了「光是什么」和「信息的极限」之后,我们来回答一个最实际的问题:光到底是怎么「背」着比特在光纤里跑的?

光波有四个可以被调制(改变)的基本物理量:

物理量 调制方式 简单例子 信息密度
振幅(光的亮度) OOK, PAM4 手电筒的开/关 = 1/0 低 → 中
频率(光的颜色) FSK 红光 = 1,蓝光 = 0
相位(波的位移) BPSK, QPSK 波峰对齐 = 0,波峰偏移半个周期 = 1 中 → 高
偏振(振动方向) DP (双偏振) 在水平和垂直方向各传一路信号 容量翻倍

最简单的方式是OOK(On-Off Keying)——光亮代表 1,光灭代表 0。这就像你对着远处用手电筒打莫斯密码。但现代光通信系统已经远超这种简单方式:通过同时调制振幅和相位,再利用双偏振,一个符号周期就可以携带 8 个甚至更多比特。这些高级调制技术将在模块三详细展开。

1.4 模拟 vs 数字:为什么数字信号胜出

早期的电话网络使用模拟信号——声音直接被转化为连续变化的电信号。这个方式直觉上更「自然」,为什么我们最终全面转向了数字通信?

提示:想想长距离传输中,噪声对连续信号和离散信号的影响有何不同。

这是通信史上最重要的架构决策之一。答案的核心是:数字信号可以被完美地再生(regenerate),而模拟信号不行

当模拟信号在光纤(或任何信道)中传输时,噪声会不可避免地叠加上去。每经过一个中继器放大,噪声也被放大——信号质量不可逆地恶化。而数字信号只有 0 和 1 两种状态:在每个中继点,我们只需判断「这个信号更接近 0 还是 1」,然后重新生成一个干净的新信号。这就像传话游戏中,如果每个人不是口头转述(模拟),而是把听到的话写下来再交给下一个人(数字),信息就不会失真。

信号在多级传输中的退化对比 模拟 原始信号 +噪声 噪声严重积累 ✗ 数字 原始信号 判决 + 再生 ✓ 信号完美保持 ✓

图 1-3:模拟信号在逐级放大中噪声不断积累,最终不可辨识;数字信号在每级中继点可被判决再生,保持完整。

当然,数字化本身也是有代价的——你需要对模拟世界进行采样量化。奈奎斯特定理告诉我们,采样率必须至少是信号最高频率的两倍,才能不丢失信息。这些数学基础将在模块三中详细讨论。

1.5 光通信的价值:为什么光纤改变了世界

在结束模块一之前,让我们从「价值」的角度总结光通信为什么如此重要。这不仅仅是一个技术问题——它是现代文明的基础设施。

超大容量
单根光纤已实现超过 100 Tbps 的实验室传输记录。全球互联网流量的 99% 以上通过光纤传输。
🌍
超远距离
跨洋海缆可达 10,000+ km,配合 EDFA 放大器实现无电中继传输。这是连接各大洲的唯一实用方式。
🔒
抗干扰
光纤是介质波导,不辐射电磁波,也不受外部电磁场干扰——在工厂、医院等强电磁环境中尤为重要。
🪶
轻量细巧
一根 125 μm 直径的光纤承载的信息量,相当于数千根铜缆。节省管道空间和重量。
核心公式 ⑤:分贝定义 (dB)
衰减 (dB) = −10 × log₁₀(P_out / P_in)
dB 是光通信中最常用的单位。0.2 dB/km 意味着每公里信号功率衰减约 4.5%。
100 km 后:0.2 × 100 = 20 dB → 信号功率降为原来的 1/100。
核心公式 ⑥:分贝毫瓦 (dBm)
P(dBm) = 10 × log₁₀(P / 1 mW)
dBm 是绝对功率单位。0 dBm = 1 mW。典型激光器输出约 0~+6 dBm,光电探测器灵敏度约 −20~−28 dBm。
1.5.5 百年光通信简史

如果你想理解"今天的光通信为什么是这个样子",最好的方式是快速回顾这门学科的关键里程碑:

1865
麦克斯韦预言电磁波
四个方程统一电与磁,预言光速电磁波——光通信的理论种子。
1948
Shannon《通信的数学理论》
定义了信道容量的绝对上限 C=B·log₂(1+SNR),至今仍是光通信的"圣经"。
1960
Maiman 发明激光器
首次实现受激辐射,为光通信提供了相干、单色、高强度的光源。
1966
高锟提出低损耗光纤构想
预言玻璃纤维可实现 <20 dB/km 损耗——被誉为"光纤之父",2009 年获诺贝尔物理学奖。
1970
康宁造出 20 dB/km 光纤
Corning 首次制出满足通信要求的超低损耗光纤,光通信商业化正式起步。
1987
EDFA 发明
掺铒光纤放大器让 C-Band 全光放大成为可能,跨洋无电中继传输时代开启。
1995
DWDM 商用化
一根光纤同时承载数十个波长,容量指数级增长,成为互联网骨干网的关键基础设施。
2010
100G 相干传输商用
DP-QPSK + 相干 DSP 成为长途骨干标准,彻底终结传统 DCF 色散补偿架构。
2020
400G ZR / 800G 问世
可插拔相干光模块 (QSFP-DD) 进入城域与数据中心互联(DCI),路由光网络融合时代到来。
2024+
CPO / 硅光子 / AI 原生光网络
共封装光学 (CPO) 将光引擎直接集成在交换 ASIC 旁;硅光子驱动光 I/O;AI 数据中心对光通信提出全新需求。

观察:从 Shannon 到 100G 相干花了 62 年;从 100G 到 800G 只用了 10 年。光通信的加速度正在提升——这也是为什么今天学习光通信原理比任何时候都更有价值。

1.6 模块一回顾:核心要点
🎯 模块一:7 个核心要点
  • 光是电磁波——麦克斯韦方程统一了光学与电磁学。光速 c = 1/√(μ₀ε₀) 是时空本身的属性。
  • 光具有波粒二象性——波动性决定了传输行为(衍射、折射),粒子性(光子)决定了发射与探测行为。E = hf。
  • 光的频率极高(~200 THz)——这赋予了它远超微波/射频的可用带宽,是大容量通信的物理基础。
  • 1310 nm 和 1550 nm 是黄金波段——由二氧化硅光纤的衰减特性决定。C-band(1550 nm)衰减最低且与 EDFA 增益窗口重合。
  • 香农公式 C = B log₂(1+SNR)——定义了通信系统的理论极限。光通信的进化就是不断逼近这个极限。
  • 光的振幅、频率、相位、偏振都可以携带信息——从简单的 OOK 到复杂的 DP-16QAM,本质都是调制这四个物理量。
  • 数字通信胜出的根本原因是信号可再生——克服了模拟通信中噪声积累不可逆的致命缺陷。

反思:光在光纤中传输时,0.2 dB/km 看起来很小,但传输 100 km 就衰减了 20 dB(功率降为 1%)。那么,有没有办法在传输途中把光信号「放大」回来,而不需要先转成电信号?如果可以,这会对整个网络架构产生什么影响?

→ 这个问题将在模块二中通过 EDFA(掺铒光纤放大器)得到解答。
Module 2

光纤——光的高速公路

Optical Fiber — The Highway of Light

📐 5+ 核心公式 📖 约 3 500 字 🔑 8 个核心要点
🤔 模块引导问题
模块一告诉我们:光是携带信息的最佳载体。
但光在自由空间中会发散、被大气吸收和散射。我们如何把一束光"关"在一根比头发丝还细的玻璃丝里,并让它跑上数千公里不"逃跑"?
答案就是全内反射 (Total Internal Reflection)——光纤通信最核心的物理原理。

§2.1 光纤的结构与制造

🤔 思考
一根直径只有 125 µm(约人类头发的直径)的玻璃丝,为什么能在数十年里承载全球 95% 以上的数据流量?它的内部构造到底有什么精巧之处?

三层同心圆结构

光纤(Optical Fiber)的横截面由三层同心圆组成,从内到外分别是:

  1. 纤芯 (Core):掺锗(GeO₂)的高纯度 SiO₂ 玻璃,折射率较高(n1 ≈ 1.468)。光信号就在这里传播。
  2. 包层 (Cladding):纯 SiO₂ 玻璃,折射率较低(n2 ≈ 1.465)。它与纤芯形成折射率差,让全内反射成为可能。
  3. 涂覆层 (Coating / Buffer):丙烯酸酯等聚合物保护层,抵御机械应力和微弯。
横截面 Cross-Section 涂覆层 250 µm 包层 125 µm 9 µm 涂覆层 包层 纵截面 Longitudinal Cladding (n₂ ≈ 1.465) Core (n₁ ≈ 1.468) 光在纤芯中沿锯齿路径传播(全内反射)

图 2-1 光纤的横截面与纵截面结构。单模光纤 (SMF) 纤芯直径约 9 µm,包层 125 µm,涂覆层 250 µm。

💡 生活类比 — 水管
把光纤想象成一根水管:纤芯是管道的空心部分,水(光)在里面流;包层是管壁,把水"约束"在管内;涂覆层则是管外的保温层,用来保护管壁不受外力破坏。

制造工艺:预制棒 + 拉丝

光纤的制造分为两大步骤:

  1. 制造预制棒(Preform):先用化学气相沉积法(MCVD / OVD / VAD 等工艺),在高温下将极纯的气态硅化物沉积成一根约 1 米长、直径数厘米的玻璃棒。这根棒的截面结构就是光纤的"放大版"——中心是高折射率的纤芯材料,外围是低折射率的包层材料。
  2. 拉丝(Drawing):把预制棒放进拉丝塔顶部的高温炉中(约 2000°C),玻璃软化后靠重力自然下垂,在精密控制下被拉成直径仅 125 微米(µm) 的光纤——比人的头发(约 50µm)粗不了多少。拉丝速度可达每秒数十米,一根预制棒可以拉出几百公里的光纤。

拉出的光纤立即被涂上一层保护性的丙烯酸酯涂覆层(Coating),使总直径达到约 245µm,以保护脆弱的玻璃不受划伤和潮气侵蚀。

▼ 为什么光能被"关"在玻璃里? ▼

§2.2 全内反射——光纤的物理基石

🤔 思考
当你潜入泳池底部向上看水面时,会发现超过一定角度后水面变成了一面"镜子",看不到外面的世界——这就是全内反射。那么,全内反射发生的条件到底是什么?为什么纤芯折射率一定要大于包层?

折射率 (Refractive Index)

当光从真空进入介质,速度会变慢。折射率定义为:

折射率定义 n = c / v c 为真空光速 ≈ 3×10⁸ m/s;v 为光在介质中的速度。SiO₂ 玻璃 n ≈ 1.46–1.47。

Snell 定律

光在两种折射率不同的介质界面发生折射,入射角 θ1 与折射角 θ2 满足:

Snell 定律 (Snell's Law) n1 sin θ1 = n2 sin θ2 角度均相对于界面法线。n1 > n2 时光从光密介质射向光疏介质。

临界角与全内反射

n1 > n2(光从纤芯射向包层),随着入射角 θ1 增大,折射角 θ2 趋向 90°。令 θ2 = 90° 即得临界角 θc

临界角公式 sin θc = n2 / n1 当入射角 θ1θc 时,光全部被反射回纤芯——这就是全内反射 (Total Internal Reflection, TIR)

关键结论:纤芯折射率必须大于包层(n1 > n2),否则不存在临界角,TIR 无法发生,光就会"逃逸"到包层中去。

纤芯 Core (n₁) 包层 Cladding (n₂ < n₁) ① θ₁ < θc 发生折射 θ₁ θ₂ ② θ₁ = θc 恰好临界 θc ③ θ₁ > θc 全内反射 θ>θc TIR ✓

图 2-2 Snell 定律与全内反射三种情形。当入射角超过临界角 θc,光被 100% 反射回纤芯。

为什么纤芯折射率必须大于包层?——数学推导

让我们做一个简洁的推导。全内反射要求:

  1. 光从纤芯(n₁)射向包层(n₂)的界面;
  2. 入射角 θ₁ 大于临界角 θc;
  3. 临界角由 sin θc = n₂ / n₁ 决定。

sin θc 必须是一个有意义的值(≤ 1),因此需要 n₂ / n₁ ≤ 1,即 n₁ ≥ n₂。如果 n₁ < n₂(纤芯折射率低于包层),sin θc 会大于 1,临界角不存在,全内反射永远不会发生——光全部泄漏到包层中。

结论:纤芯折射率必须大于包层折射率,才能形成全内反射,把光锁在纤芯中。这就是光纤能传导光的根本物理原因。

💡 数值示例

假设纤芯 n₁ = 1.48,包层 n₂ = 1.465:
sin θc = 1.465 / 1.48 = 0.9899θc ≈ 81.9°
只要光以大于 81.9° 的入射角(接近"擦着"界面的角度)进入纤芯-包层界面,就会被全反射回来。在光纤中,这个条件很容易满足。

数值孔径 (Numerical Aperture, NA)

NA 描述光纤能够接受的最大入射光锥角,是衡量光纤"集光能力"的关键参数:

数值孔径 NA = sin θa = √(n1² − n2²) θa 为光纤端面的最大受光角 (acceptance angle)。SMF 的 NA ≈ 0.12–0.14;MMF 的 NA ≈ 0.20–0.275。
💡 生活类比 — 漏斗
NA 就像漏斗口的大小:漏斗口越大(NA 越高),能接收的水(光)越多,但对水流方向的约束就越弱——这正是多模光纤 NA 较大但模间色散也更严重的根本原因。
▼ 模式:几何光学之上的波动故事 ▼

§2.3 多模 vs 单模光纤

🤔 思考
在几何光学中,满足全内反射条件的光线可以有很多不同的入射角——每一条不同角度的"锯齿"路径长度不同。如果很多条路径同时携带信号,到达终点的时间就有先有后。怎样把"多条路径"减少为"一条路径"?答案取决于一个参数——V 参数。

模式 (Mode) 的概念

从波动光学角度看,光在光纤纤芯中传播时,只有满足横向驻波条件的特定场分布才能稳定存在——这些稳定的场分布被称为模式 (Mode)。每个模式对应不同的传播常数 β,沿光纤传播的速度也不同。

V 参数(归一化频率)

V 参数 (V-number) V = (2πa / λ) × NA a = 纤芯半径,λ = 工作波长,NA = 数值孔径。
当 V < 2.405 时,光纤只允许基模传播——即为单模条件。

直觉上理解 V 参数:纤芯越粗a↑)、折射率差越大(NA↑)、波长越短λ↓),V 越大,能支持的模式越多。反之,缩小纤芯、降低 NA、使用长波长,才能实现单模。

三种光纤类型对比 ① 阶跃多模 Step-Index MMF 折射率分布 不同模式路径长度差异大 → 模间色散严重 ② 渐变多模 Graded-Index MMF 抛物线折射率 外侧光速较快 → 补偿路径差 → 色散大幅减小 ③ 单模 SMF (V < 2.405) 极小芯径 仅基模 LP₀₁ → 零模间色散 → 长距离首选

图 2-3 阶跃多模、渐变多模与单模光纤的折射率分布和光线传播对比。

多模光纤分类 (OM 等级)

等级芯径 (µm)折射率类型带宽·距离典型应用
OM162.5渐变200 MHz·km @850nm百兆以太网 ≤300 m
OM250渐变500 MHz·km @850nm1GbE ≤550 m
OM350渐变(优化)2000 MHz·km @850nm10GbE ≤300 m
OM450渐变(优化)4700 MHz·km @850nm40/100GbE ≤150 m
OM550渐变(宽带优化)支持 SWDM 850–953nm短波波分复用

单模光纤标准

ITU-T 标准名称关键特性典型应用
G.652标准 SMF零色散 @1310nm;全球部署量最大城域/长途
G.654截止波长位移 SMF大有效面积,低衰减 @1550nm海缆、超长距
G.655非零色散位移 SMF (NZ-DSF)C 波段色散 ≠ 0,抑制 FWMDWDM 长途
G.657弯曲不敏感 SMF小弯曲半径 (≤7.5mm) 低损耗FTTH 入户

多模光纤 vs 单模光纤——全方位对比

特性 多模光纤 (MMF) 单模光纤 (SMF)
纤芯直径 50µm 或 62.5µm 8–10µm
包层直径 125µm 125µm
传导模式数 数百到数千个 仅 1 个(基模 LP₀₁)
典型波长 850nm、1310nm 1310nm、1550nm
光源 LED 或 VCSEL 分布反馈激光器(DFB Laser)
典型传输距离 数百米至 ~2km 数十公里至数千公里
带宽能力 受模式色散限制,较低 极高(无模式色散)
典型应用场景 数据中心内部、楼内互联 城域网、长途骨干、DWDM 系统
成本 光纤和连接器便宜,光源便宜 光纤便宜,但精密激光器和对准成本较高
护套颜色(惯例) 橙色 或 浅蓝色(Aqua) 黄色(UPC)或 绿色(APC)
💡 生活类比 — 走廊 vs 独木桥
多模光纤像一条宽走廊——很多人可以并排走,但速度不同的人到终点时间不一样(模间色散)。单模光纤像一座独木桥——只允许一人通行,虽然"入口"更小,但所有信息以完全相同的速度到达,适合远距离赛跑。
▼ 光走远了,信号变弱了——衰减 ▼

§2.4 衰减——信号的能量代价

🤔 思考
即使全内反射完美无缺,光在玻璃中传播数十公里后还是会变弱。能量去了哪里?又为什么偏偏在 1550 nm 附近损耗最低?

衰减的三大来源

  1. 吸收损耗 (Absorption)
    • 紫外吸收:SiO₂ 电子跃迁,波长越短越严重。
    • 红外吸收:Si-O 键振动吸收,波长 > 1600 nm 后急剧上升。
    • OH⁻ 吸收峰:水分子残余在 ~1383 nm 形成吸收峰(现代"低水峰"光纤已基本消除)。
  2. 瑞利散射 (Rayleigh Scattering):SiO₂ 在冷却过程中"冻结"的微观密度涨落(亚波长尺度)会散射光能。散射强度与波长的四次方成反比:
瑞利散射 αR ∝ 1 / λ⁴ 波长越短,散射越强。这就是为什么 850 nm 窗口衰减高于 1310 nm 和 1550 nm。
  1. 弯曲损耗 (Bending Loss):宏弯(光缆走线弯折)和微弯(涂覆层不匀对纤芯的微压)都可使光从纤芯泄漏。G.657 光纤专为弯曲不敏感优化。

衰减的量化

衰减公式 Pout = Pin × 10−αL/10 α 为衰减系数 (dB/km);L 为光纤长度 (km)。
典型值:1550 nm ≈ 0.20 dB/km;1310 nm ≈ 0.35 dB/km;850 nm ≈ 2.5 dB/km。
换言之,在 1550 nm 窗口,100 km 光纤仅引入 20 dB 损耗。
衰减 (dB/km) 0 1 2 3 4 波长 (nm) 700 900 1100 1300 1400 1550 1700 OH⁻ 峰 ~1383nm 红外吸收↑ 850nm ~2.5 dB/km O-Band ~0.35 C-Band ★ ~0.20 ← Rayleigh ∝ 1/λ⁴

图 2-4 SiO₂ 光纤的衰减谱。C-Band (1550 nm) 衰减最低约 0.20 dB/km,是 DWDM 长距传输的最佳窗口。

为什么 1550 nm 最优? 这是紫外侧瑞利散射(短波长强)与红外侧分子振动吸收(长波长强)两条衰减曲线的"谷底"——大自然为光通信留下的黄金窗口。

▼ 光走远了,脉冲变宽了——色散 ▼

§2.5 色散——脉冲展宽的元凶

🤔 思考
衰减只是让信号变弱,加个放大器就能补回来。但还有另一种损伤——色散 (Dispersion):它让原本窄窄的脉冲逐渐展宽,最终相邻脉冲重叠、无法分辨。色散来自何处?有哪些类型?如何量化和对付它?

色散的物理图像

一个光脉冲并非单一频率,而是由一组频率(或波长)分量叠加而成。如果不同频率分量在光纤中传播速度不同,脉冲到达接收端时各分量就会"散开"——表现为脉冲展宽。当展宽大到相邻比特重叠,就产生了码间干扰 (Inter-Symbol Interference, ISI),直接限制传输速率和距离。

色散的三种类型

① 材料色散
(Material Dispersion)

玻璃的折射率随波长变化(即 n = n(λ)),所以不同波长的光在玻璃中速度不同。激光器发出的光并非完美的单一波长,而是有一定谱宽——这些略有差异的波长成分以不同速度传播,导致脉冲展宽。

类比:一群跑步者速度不同,出发时挤在一起,跑远了就拉开了差距。

② 波导色散
(Waveguide Dispersion)

光在纤芯中并非 100% 被束缚——约有 20% 的光能量延伸到包层中。不同波长的光,其能量在纤芯与包层中的分布比例不同,因此有效折射率不同、传播速度不同。波导色散通常与材料色散符号相反,两者叠加后形成色度色散(Chromatic Dispersion, CD)

③ 偏振模色散
(PMD)

理想光纤是完美圆形截面,但实际光纤总有微小的椭圆度和内应力,导致两个正交偏振模式(X 和 Y 方向)的传播速度略有差异。脉冲在两个偏振方向上的分量到达时间不同,造成展宽。PMD 是随机的、时变的,难以简单补偿。

单位:ps/√km;10G 系统容忍约 10ps,100G 以上需要相干 DSP 补偿。


色度色散 (CD) 详解

色度色散是单模系统中最重要的色散类型,由两部分叠加:

两者之和 D(λ) 的单位是 ps/(nm·km)——即每公里光纤中,每 nm 光谱宽度引起的脉冲展宽 (ps)。

色度色散引起的脉冲展宽 Δτ = |D| × Δλ × L D = 色散参数 [ps/(nm·km)];Δλ = 光源谱宽 (nm);L = 光纤长度 (km)。
例:D=17,Δλ=0.1nm(外调制 DFB),L=100km → Δτ = 170 ps。对 10G NRZ(bit period=100ps)已产生严重 ISI。
发射端 Tx 窄脉冲 光纤传播 50 km 稍有展宽 接收端 Rx (100 km) 严重展宽 → ISI

图 2-5 色散引起脉冲展宽:传输距离越长,脉冲越宽,最终相邻比特重叠产生 ISI。

偏振模色散 (PMD)

理想光纤是完美圆对称的,但实际制造中的微小椭圆度和外部应力会使两个正交偏振态(水平 / 垂直)的传播速度略有不同。PMD 的均值增长方式与 CD 不同——它与距离的平方根成正比,且具有随机统计特性,难以用固定补偿器消除。现代光纤的 PMD 系数已降至 ≤0.1 ps/√km,但在 400G+ 相干系统中仍需 DSP 动态补偿。

色散补偿策略(预告)

💡 生活类比 — 马拉松赛跑
想象一场马拉松:一群速度各异的跑者(不同波长/偏振的光)同时起跑。跑短距离时大家还挤在一起;跑完 42 公里后,快的已经冲线、慢的才到一半——队伍被"色散"拉开了。
DCF 色散补偿就像在终点前设一段"倒跑赛道",让跑得快的人折返一段,等慢的追上来再一起冲线。
相干 DSP则更高级——裁判(接收端)记住每个人的速度差,然后在计算中把所有人的到达时间"对齐"。
▼ 当光足够强——非线性效应 ▼

§2.6 非线性效应——光纤的"力量极限"

🤔 思考
衰减让信号变弱,色散让脉冲展宽——这两者都是线性效应,理论上可以被完全补偿。但当我们为了对抗衰减而把光功率提高时,光纤本身的折射率开始随光强变化——非线性效应登场了。它为系统容量设定了一个不可逾越的"天花板"。

Kerr 效应

光纤 SiO₂ 的折射率在高光功率下不再恒定,而是与光强 I 成正比:

Kerr 效应 n(I) = n0 + n2 · I n2 ≈ 2.6 × 10⁻²⁰ m²/W(极小,但在长距离 × 小模场面积的光纤中效果积累显著)。

Kerr 效应衍生出三种主要非线性损伤:

非线性效应物理机制对系统的影响
自相位调制
(SPM)
信号自身强度调制引起折射率变化 → 自身频率啁啾 与 CD 交互加剧脉冲畸变
交叉相位调制
(XPM)
DWDM 中相邻信道强度变化导致本信道折射率波动 信道间串扰
四波混频
(FWM)
三个频率分量的参量混频产生新频率 当信道等间距 + 低色散时尤为严重(这也是 G.652 零色散点不在 C 波段反而是优势的原因——非零色散可抑制 FWM

另一大类非线性:受激散射(Stimulated Scattering)

Kerr 效应来源于折射率的"光强依赖"——是一种"弹性"非线性(不改变光子能量)。而受激散射是一类"非弹性"非线性——光子与光纤中的声子(振动能量)或分子振动发生能量交换,产生频率不同的新光波。它们是现实系统中不可忽视的"硬物理限制":

效应 英文全称 物理机制 对系统的影响
SBS Stimulated Brillouin Scattering
受激布里渊散射
光子与光纤声子耦合,产生频率下移约 11 GHz 的后向散射光 窄线宽、高功率的单频信号极敏感。阈值功率低至 +7~+10 dBm。超过阈值后,大量功率被反射回发射端,不仅浪费能量,还会损坏激光器。
应对:给激光器加相位抖动(dithering)或使用较宽线宽,把功率谱"摊薄"到 SBS 阈值以下。
SRS Stimulated Raman Scattering
受激拉曼散射
光子与 SiO₂ 分子振动耦合,能量从短波长信道转移到长波长信道,频移约 13 THz(~100 nm) 在 C+L 波段大宽带 DWDM 系统中,C 波段的短波长信道会"喂养"L 波段的长波长信道,导致功率倾斜(Power Tilt)——短波衰减、长波增强。
应对:均衡器预倾斜、或利用 SRS 做拉曼放大器(把"敌人"变"朋友")。
🔄 化敌为友:受激拉曼放大器
SRS 本是损伤,但聪明的工程师把它反过来用了:在光纤近端注入一束 1450 nm 的强"泵浦光",通过 SRS 效应把能量持续传递给 1550 nm 的信号光——这就是分布式拉曼放大(DRA, Distributed Raman Amplification)。它的独特优势是"放大发生在整根光纤上"而非集中点,显著降低等效噪声系数,是超长距海缆系统的标配技术。

工程启示:非线性效应设定了"入纤功率上限"——功率不能无限提高。这与衰减(需要高功率)和 Shannon 定理(SNR 越高容量越大)形成了根本矛盾,最终定义了光纤系统的非线性 Shannon 极限——我们将在后续高级模块中深入探讨。

⚠️ 终极碰撞:当香农极限遇上光纤非线性

经典的香农公式告诉我们:不断提高发射功率(提升 SNR),容量就能无限增长。但这在光纤中被打破了!当光功率超过最佳阈值(通常在几毫瓦量级),Kerr 非线性效应会引发严重的串扰和畸变。这导致实际信道容量在达到峰值后,随着功率增加反而暴跌——这就是光通信领域最著名的“非线性香农极限(Nonlinear Shannon Limit)”

光纤的“非线性香农极限”折返曲线 入纤功率 (Power) / SNR → 频谱效率 (容量) 经典香农理论极限 (纯线性信道) 非线性惩罚导致容量雪崩 系统真实容量峰值 最佳入纤功率 (Sweet Spot) 线性区(衰减主导,增加功率有效) 非线性区(Kerr效应主导)
▼ 模块二 · 核心回顾 ▼

§2.7 模块回顾

🔑 8 个核心要点

  1. 三层结构:光纤由纤芯(高折射率)/ 包层(低折射率)/ 涂覆层组成,折射率差是一切的基础。
  2. 全内反射 (TIR):当入射角 ≥ 临界角 θc = arcsin(n2/n1) 时光被 100% 反射回纤芯——这是光纤导光的物理基石。
  3. 数值孔径:NA = √(n1² − n2²),衡量光纤的集光能力。
  4. V 参数 < 2.405:单模条件。纤芯越细、NA 越小、波长越长 → 模式越少。
  5. 单模 vs 多模:SMF 消除模间色散,适合长距高速;MMF 芯径粗、耦合容易,适合数据中心短距。
  6. 衰减:瑞利散射 (∝1/λ⁴) + 吸收 + 弯曲损耗。1550 nm 是衰减最低点 (~0.20 dB/km)。
  7. 色散:CD 使脉冲展宽、产生 ISI;PMD 具有随机性。色散可通过 DCF 或相干 DSP 补偿。
  8. 非线性效应:Kerr 效应 (SPM/XPM/FWM) 设定了入纤功率上限,与衰减形成根本矛盾,最终决定系统容量极限。
🤔 通往模块三的桥梁
我们已经拥有了优秀的载体(光)和高速公路(光纤)。但光本身只是一束电磁波——如何在光波上"写入"和"读出"数字信息?

最简单的方法是 "亮=1,灭=0"(OOK),但这效率太低。如果我们不只控制亮灭,还控制振幅的大小 (PAM4)光波的相位 (PSK)、甚至振幅+相位同时调制 (QAM)呢?

模块三:调制与解调——信息的编码之术,将从最简单的开关键控走向最前沿的相干正交调制,揭示光通信系统如何在同一根光纤中塞入越来越多的比特。
Module 03 of 03

调制与解调

光是载体,光纤是通道,但信息到底是怎样"坐上"光波的?从最简单的"开灯/关灯"到一秒钟传输 800 Gb 的 DP-16QAM——这是一场关于信号、数学与工程智慧的精彩旅程。

假设你要把一张高清照片从北京发到纽约——大约 10 MB 的数据。如果按照模块一里 OOK 的方式(有光=1、无光=0),在一根传输速率 10 Gb/s 的光纤上只需 8 毫秒。那么问题来了:我们真的把光的"潜力"用尽了吗?光波除了"亮"和"灭",还有没有别的"维度"可以用?

提示:回忆一下模块一中提到的光波的四个可调制维度。
3.1 调制的本质——让光波"背上"信息

What — 什么是调制?

调制 (Modulation) 是把"信息信号"(基带信号,Baseband)加载到"载波信号"(Carrier)上的过程。在光通信中,载波就是一束频率约 200 THz 的光波,调制的任务就是通过改变光波的某一个(或几个)物理属性来编码 0 和 1。

类比:广播电台

FM 广播(调频)通过改变无线电波的频率传递声音,AM 广播(调幅)通过改变振幅传递声音——载波都是几百兆赫兹的无线电波,信息都是几千赫兹的音频信号。光通信本质上也是"广播",只是载波频率从 100 MHz 跃升到 200 THz——翻了 100 万倍,能塞进去的"节目"自然也多了 100 万倍。

Why — 为什么必须调制?

这个问题有三层答案,一层比一层深:

  1. 基带信号无法直接传输:我们想传的是数字比特流(0/1 脉冲),它的频谱从 0 Hz 开始——这样的信号无法在光纤这样的高频介质上有效传播。必须"搬移"到光频段。
  2. 频分复用的基础:不同信息可以被调制到不同频率的载波上,同时在同一根光纤中并行传输而互不干扰——这就是 DWDM(密集波分复用)的核心思想,模块五、六将详述。
  3. 逼近香农极限:回顾 C = B·log₂(1+SNR)。同样的带宽 B、同样的 SNR 下,聪明的调制方式能让频谱效率(bits/s/Hz)翻倍甚至翻八倍。这是光通信从 10G → 100G → 400G → 800G → 1.6T 进化的核心动力。
未调制载波(纯净光波)

一束"空白"光波本身不携带信息,通过有规律地改变振幅 A、频率 f 或相位 φ,就能把 0 和 1 "写"到光上。

How — 光波的四个可调制维度

一个单色光波的完整描述包含四个物理量:

核心公式 ⑦:光波的完整表达
E(t) = A · cos(2π·f·t + φ) · ê
A(振幅 Amplitude) · f(频率 Frequency) · φ(相位 Phase) · ê(偏振方向 Polarization)

这四个量中的任何一个被改变了,都意味着"调制"在发生:

🔆
振幅 A
最直观——光亮=1、光暗=0,这就是 OOK。若用多个亮度等级就是 PAM。
🌈
频率 f
用不同"颜色"的光代表不同比特。FSK 曾用于早期光通信,现代已少用单独 FSK,但 DWDM 本质是频率多路复用。
🔄
相位 φ
光波的"起跑时刻"不同——肉眼完全看不出,但仪器能精确分辨。PSK 系列的核心武器。
✖️
偏振 ê
光波电场振动的方向(水平/垂直)。两个正交方向可承载两路独立信号——容量直接翻倍!
光波的四个可调制维度 ① 振幅 Amplitude "0" (低振幅) "1" (高振幅) ② 频率 Frequency 低频 高频 ③ 相位 Phase 相位 0 相位 π(反相) ④ 偏振 Polarization X-偏振(水平) Y-偏振(垂直) 两路正交 = 容量翻倍

图 3-1:光波的四个可调制维度。现代高阶相干调制技术同时利用振幅、相位、偏振三个维度(频率用于 DWDM)。

💡 物理实现机制:马赫-曾德尔调制器 (MZM)

你可能会好奇:光速那么快,频率那么高,工程师到底是如何在物理上瞬间改变光的"振幅"和"相位"的?光通信工业界使用了一种极其精妙的结构——马赫-曾德尔干涉仪 (Mach-Zehnder Modulator, MZM)

分流与汇合的艺术:想象把一条水流(连续的激光)平均分成两条支流。如果在其中一条支流的管道上施加电压,利用特殊材料的电光效应改变它的折射率,这条支流里的光速就会微调,从而产生"相位延迟"。当两条支流再次汇合时:

施加调制电压 (V) 改变折射率 → 产生相位差 Δφ 连续激光输入 参考路径 (相位恒定) 建设性干涉 (1) 波峰叠加 → 变亮 破坏性干涉 (0) 波峰抵消 → 变暗

建设性干涉:如果两束光汇合时波峰对波峰(相位一致),就会叠加变亮(输出 1)。
破坏性干涉:如果波峰对波谷(相差 180°/π),就会互相抵消变暗(输出 0)。
通过巧妙控制电压,我们就能用电信号精准把控光的明暗与相位跳转。现代的硅光模块,本质上就是在微米级的芯片上刻蚀了无数个这样微小的"分流汇合"干涉仪!

🔍 核心概念辨析:波特率 (Baud Rate) vs 比特率 (Bit Rate)

在进入调制之前,必须厘清这两个极易混淆的概念,这是理解所有光模块参数的钥匙:

  • 波特率 / 符号率 (Baud Rate):物理层面的“动作频率”,指一秒钟内光波状态(符号)改变的次数。它直接决定了系统所需的物理带宽(奈奎斯特定理)。
  • 比特率 / 数据率 (Bit Rate):信息层面的“传输速度”,指一秒钟内实际传输了多少个 0/1。

公式:比特率 = 波特率 × 每个符号携带的比特数

💡 物流车队类比:波特率就像是车队在高速公路上往返的“车次/小时”;比特率是总共运送的“货物吨数/小时”。高阶调制(如 16QAM)的作用就是把每辆小货车(1 吨)换成重型卡车(4 吨),从而在不增加车次(不占用更多公路带宽)的情况下,成倍提升总运力。

3.2 OOK——最简单的调制方式

What — OOK 是什么?

OOK(On-Off Keying,开关键控) 是最简单、历史最悠久的光调制方式:有光代表 1,无光代表 0。本质上就是"激光器开/关"的数字化控制。

How — OOK 的两种波形:NRZ vs RZ

即使同样是 OOK,比特如何"占据时间槽"也有讲究:

NRZ 与 RZ 波形对比(比特序列: 1 0 1 1 0 1) 1 0 1 1 0 1 NRZ On (1) Off (0) RZ On Off 时间 t →

图 3-2:同一个比特序列的 NRZ 与 RZ 波形对比。NRZ 频谱占用小;RZ 时序清晰但带宽需求更大。

Why — OOK 的致命弱点

OOK 的核心问题在于接收端采用 直接检测(Direct Detection, DD):光电二极管输出的电流正比于入射光强度的模平方 |E|²——所有关于相位的信息完全丢失了

类比:只能分辨"亮"和"暗"的摄像机

想象一台黑白低分辨率摄像机:它只能告诉你画面的明暗变化,但完全看不到颜色(频率)、也分辨不出纹理细节(相位)。OOK + DD 就是这样一套系统——你只用了光的一个维度,忽略了其他三个。这就像用一辆十车道高速公路只跑一辆车。

OOK 的频谱效率是 1 bit/symbol——每个符号(时间片)只承载 1 比特。想要再把速率翻倍,只能靠提高波特率(符号率)。但波特率受限于器件带宽和色散——这就是为什么 10G NRZ 可以长距离传输,但 40G NRZ 就举步维艰、25G NRZ 只能走几公里的根本原因。

🚧 深度解析:为什么不能无限提高波特率?

波特率(即每秒发送符号的次数)的提升并非没有代价,它主要受限于硬件电路的响应极限与光纤物理特性的平方级惩罚

  • 1. 器件与频谱带宽瓶颈(硬件限制):
    • 高频电子器件极限:提高波特率意味着光网络的核心组件(包括激光器、调制器、DAC 和 DSP)必须在极高的频率下进行切换。受限于材料物理特性和高频微波电路的瓶颈,器件的响应带宽存在硬性上限。
    • 信道频谱挤占:波特率的增加会成比例地扩大信号所需的物理频谱宽度。例如,将波特率从 32 Gbaud 提升到 64 Gbaud,信号所需的信道大小会从 37.5 GHz 扩大到 75 GHz。传统固定频带(Fixed Grid)的 DWDM ROADM 系统往往受限于固定的“车道”宽度,无法容纳如此宽的信号。
  • 2. 色散限制(物理法则的残酷惩罚):
    • 线宽变宽:波特率越高,意味着每一个光脉冲在时间上越短,这导致信号的光谱线宽(Linewidth)变得更宽。
    • 平方级惩罚:最致命的物理法则是——光纤色散对信号的影响与波特率的平方成正比。这意味着波特率翻倍,色散的破坏力会急剧增加 4 倍
    • 码间干扰 (ISI) 爆发:由于这种平方级的色散放大效应,高波特率的光脉冲在极短的传输距离内就会被拉宽、抹平,导致前后脉冲严重重叠,接收端将完全无法分辨独立的信号。
3.3 高阶调制——从 PAM4 到 DP-16QAM

3.3.1 PAM4——让光的亮度有 4 个台阶

What

PAM4(4-Level Pulse Amplitude Modulation,4 电平脉冲振幅调制) 是 OOK 的直接升级:把光强分成 4 个等级(00、01、10、11),每个符号承载 2 bits

PAM4:4 个振幅电平,每符号 2 比特 波形示意 L3 (11) L2 (10) L1 (01) L0 (00) 4 电平 × 2 bits/符号 → 同波特率下容量翻倍 振幅"星座图"(一维) 11 10 01 00 相邻距离
更小→
抗噪差

图 3-3:PAM4 波形与星座图示意。4 个电平相邻间距只有 OOK 的 1/3,对 SNR 要求更高。

Why

PAM4 是数据中心短距互联(400G DR4/FR4、800G DR8/FR8)的主流调制格式。原因是:

代价是:4 个电平相邻间距只有 OOK 两个电平的 1/3,所以对 SNR 的要求提高约 9.5 dB,对色散和非线性更敏感,传输距离受限。

3.3.2 PSK——在"相位"上做文章

振幅调制看得见,相位调制看不见——但它是现代高阶调制的基石。

BPSK(Binary PSK,二进制相位键控)

只用两个相位:0 和 π。

振幅保持不变,所以看起来光强是恒定的——但相位在 0 和 π 之间跳变。

QPSK(Quadrature PSK,四相位键控)

使用 4 个相位:π/4、3π/4、5π/4、7π/4(等价于 45°、135°、225°、315°)。每个符号携带 2 bits

PSK 星座图 —— 相位空间的二维表达 BPSK(1 bit/symbol) I Q 1 (π) 0 (0) d = 2 QPSK(2 bits/symbol) I Q 01 00 10 11 d = √2 BPSK 和 QPSK 的所有点都在单位圆上 —— 振幅恒定,只有相位变化 QPSK 的最小欧氏距离比 BPSK 小,所以 SNR 要求更高 ≈ 3 dB

图 3-4:BPSK 与 QPSK 的星座图。QPSK 在不增加波特率的情况下容量翻倍,是相干光通信的基础。

3.3.3 QAM——同时控制"亮度"和"相位"

What — I/Q 分解

任何一个单频正弦信号都可以分解为两个正交分量:

核心公式 ⑧:I/Q 分解
s(t) = I · cos(2π·f·t) − Q · sin(2π·f·t)
I(In-phase,同相分量)和 Q(Quadrature,正交分量)——通过这两个数值的组合,可以任意构造信号的振幅和相位。
振幅 = √(I² + Q²);相位 = arctan(Q/I)

也就是说,I 和 Q 是信号的"笛卡尔坐标"——在 I/Q 平面上画一个点,就对应一个特定振幅+相位的光波。这就是星座图的数学本质。

类比:GPS 坐标 vs 极坐标

描述北京鸟巢的位置,你可以说"距离天安门 8 公里,方向东北偏东 30°"(极坐标:振幅+相位),也可以说"东经 116.39°、北纬 39.99°"(笛卡尔坐标:I/Q)。两种描述方式数学上完全等价,但在工程实现上,笛卡尔坐标(I/Q)要容易得多——这就是为什么所有的现代相干光调制器都使用 I/Q 结构。

16QAM 星座图

16QAM 在 I/Q 平面上摆出一个 4×4 的方阵——共 16 个点,每个符号承载 4 bits

16QAM 星座图(4×4 方阵,每符号 4 bits) I Q 0010 0110 1110 1010 0011 0111 1111 1011 0001 0101 1101 1001 0000 0100 1100 1000 最小欧氏距离 d_min 3 种振幅

图 3-5:16QAM 星座图。16 个符号点分布在 3 种振幅 × 12 种相位上(用格雷码映射最小化误码影响)。

16QAM 的关键观察:

同理,64QAM(8×8 方阵,6 bits/symbol)、256QAM(16×16 方阵,8 bits/symbol)是更高阶版本,频谱效率继续提升,但 SNR 要求也越来越苛刻。

3.3.4 偏振复用——让容量再翻倍

光波有两个正交的偏振方向(X 和 Y),它们在光纤中几乎独立传输——这意味着我们可以在这两个偏振上各发送一路独立的 QPSK/16QAM 信号,容量直接翻倍,但不消耗额外带宽

于是产生了一系列"DP-"(Dual-Polarization)调制格式:

调制格式 每符号比特数 频谱效率 64 Gbaud 总速率 典型应用距离
NRZ (OOK) 1 bit 1 bit/s/Hz 10G 短距
PAM4 2 bits 2 bit/s/Hz 100–800G 数据中心 <10 km
DP-QPSK 4 bits (2×2) 4 bit/s/Hz 256 Gb/s 100G/200G 长途 >1000 km
DP-16QAM 8 bits (4×2) 8 bit/s/Hz 512 Gb/s 400G 城域/区域 ~600 km
DP-64QAM 12 bits (6×2) 12 bit/s/Hz 768 Gb/s 800G 短距 <300 km
DP-256QAM 16 bits (8×2) 16 bit/s/Hz 1024 Gb/s 1.6T 超短距 <100 km(前沿)

综合计算示例

以一个典型的 400G 相干系统为例:

这就是现代 100G/400G/800G 相干光模块背后的"数学魔法"。信息论的每一个维度都被充分榨取了

🧮 DP-16QAM 的符号空间精确计算
X 偏振
16 个星座点
log₂(16) = 4 bits
×
Y 偏振
16 个星座点
log₂(16) = 4 bits
=
总组合
16 × 16 = 256
每符号 8 bits

关键洞察:X 和 Y 两个偏振是独立并行的通道(而非相乘后再选择),所以它们的比特数是相加(4 + 4 = 8),但两者组合的符号空间是 16 × 16 = 256——两种说法数学等价。

3.4 调制背后的数学原理

我们已经看到调制格式如何把比特"塞进"光波。但一个更深刻的问题是:这些星座图、波特率、带宽之间有没有隐藏的数学规律?为什么 16QAM 比 QPSK 快一倍,却需要更高的 SNR?为什么带宽和速率之间有一个绝对不可突破的理论上限?

提示:答案藏在三个伟大的名字里——傅里叶、奈奎斯特、香农。

3.4.1 傅里叶变换——时域与频域的桥梁

傅里叶变换(Fourier Transform)告诉我们一个惊人的事实:任何时域信号都可以被分解为无穷多个不同频率正弦波的叠加

核心公式 ⑨:傅里叶变换
S(f) = ∫ s(t) · e−j2πft dt
s(t) 是时域信号,S(f) 是它的频谱。反变换则把频谱"组合"回时域信号。
一个信号在时域看似复杂,在频域可能异常简洁,反之亦然。
类比:钢琴和弦的分解

你听到一段和弦(时域信号),钢琴调音师能告诉你它由 Do + Mi + Sol 三个音组成(频域分量)。时域是"你听到了什么",频域是"有哪些音符"。傅里叶变换就是那个"调音师的耳朵"——它把复杂波形拆解成一个个单色正弦波。

在光通信中,傅里叶变换的意义至关重要:

傅里叶变换:时域 ↔ 频域 时域 (Time Domain) t 看起来是"方波" 傅里叶变换 FT 频域 (Frequency Domain) f f₀ 3f₀ 5f₀ 7f₀ 9f₀ 实际是无穷多奇次谐波的叠加

一个"看似简单"的方波,在频域中展开为无穷多个频率成分——这就是傅里叶变换揭示的真相

3.4.2 奈奎斯特定理——带宽的绝对下限

1928 年,奈奎斯特(Harry Nyquist)证明了一个优雅而深刻的定理:

核心公式 ⑩:奈奎斯特带宽
Bmin = Rs / 2
Rs = 符号率(Symbol Rate,单位 Baud),Bmin = 无 ISI 传输所需最小带宽。
等价地:在带宽 B 的信道中,可传输的最大符号率为 2B Baud。

这个定理告诉我们:要传输 64 Gbaud 的符号流,至少需要 32 GHz 的信道带宽。这是物理定律,不可商量。

奈奎斯特脉冲成形(Nyquist Pulse Shaping)

理论上,一个理想的 sinc 脉冲——时域零点精确落在其他符号中心的脉冲——可以在最小带宽下实现无 ISI 传输。但 sinc 脉冲在时域是无限延展的,实际工程中采用升余弦(Raised Cosine)脉冲近似:

奈奎斯特脉冲成形:带宽 vs 时域响应 频域:信号频谱 f S(f) −Rs/2 +Rs/2 0 α=0.3 α=0 (理想) α↑ → 带宽占用略增,但工程可实现 时域:脉冲形状 t −2T −T 0 +T +2T 零点落在邻符号中心 → 无 ISI

图 3-6:奈奎斯特理想频谱(蓝)与升余弦频谱(橙)。时域中脉冲在相邻符号中心为零,保证无码间干扰。

3.4.3 香农极限——容量的理论天花板(再探)

回到模块一的香农公式 C = B · log₂(1+SNR),现在我们能从调制角度重新诠释它:

核心公式 ⑪:频谱效率
SE = C / B = log₂(1 + SNR)  (bit/s/Hz)
SE = 频谱效率(Spectral Efficiency),衡量每单位带宽能承载多少 bit/s。
SNR 单位为线性值(非 dB)。例:SNR=15(≈11.8dB)→ SE = log₂(16) = 4 bit/s/Hz,恰好对应 16QAM 的理想极限。

这个公式背后隐藏着一个"残酷"的对数关系:

3.4.4 星座图与欧氏距离——调制的"命门"

在星座图上,任意两个星座点之间的距离叫做欧氏距离(Euclidean Distance)。在所有距离中,最短的那个叫最小欧氏距离 dmin——它直接决定了系统的抗噪声能力:

核心公式 ⑫:误码率与 dmin 的关系
BER ∝ Q( dmin / (2σ) )
Q(·) 是高斯 Q 函数;σ 是接收噪声的标准差。
dmin 越大,接收机越容易区分不同符号,误码率越低。

这揭示了高阶调制的根本代价:在相同的平均发射功率下,星座点越密集,dmin 越小。定量地:

调制格式 星座点数 每符号比特 归一化 dmin 理论 SNR 阈值 (BER=10⁻⁹)
BPSK212.00~9.6 dB
QPSK421.41~12.6 dB
16QAM1640.63~20.0 dB
64QAM6460.31~26.5 dB
256QAM25680.15~33.0 dB

3.4.5 PCS——让星座点"有轻有重"的现代魔法

传统 QAM 中所有星座点被等概率发送——这在数学上并非最优。1975 年以来的理论告诉我们:在功率受限信道中,外围点(高能量)应该少发,内部点(低能量)应该多发,才能逼近 Shannon 极限。这就是 PCS(Probabilistic Constellation Shaping,概率星座整形) 的核心思想。

🧬 PCS 在做什么?
以 64QAM 为例:四角的 4 个外部点能量最高(功率大但对 SNR 贡献小),中心的 4 个内部点能量最低。PCS 让内部点发送概率远高于外部点(类似高斯分布),整体平均功率不变,但有效 SNR 提升 1–1.5 dB,等价于距离延伸 30–50%

更妙的是——通过连续调节外围点的抑制比例,PCS 可以实现 1 bit 精细粒度的速率调整(如 400G、450G、500G、550G…800G),而无需换硬件。这就是今天 Cisco NCS 1010 等现代 DCO 相干模块能在同一片 DSP ASIC 上支持 100G–1200G 全区间的关键。
均匀 64QAM vs PCS 64QAM ① 均匀 64QAM(所有点等概率) 所有 64 点出现概率相等 = 1/64 ② PCS 64QAM(内密外疏) 点的大小表示出现概率:内密外疏(近似高斯) PCS 可带来约 1–1.5 dB 的"成形增益"(Shaping Gain),显著延长传输距离

图 3-8:均匀分布与概率整形(PCS)星座图对比。PCS 通过调整符号发送概率,逼近高斯分布,接近 Shannon 极限。

这就是"距离 vs 容量"永恒权衡的数学根源:想要更高的频谱效率(更多 bit/s/Hz),就必须付出 SNR 的代价;SNR 不够时,只能退回低阶调制、但距离可以更长。所有现代相干光收发机都支持"灵活速率调制(Flexible Rate)"——根据链路实际信噪比,动态选择最优调制格式,把每一分 SNR 都榨干。

类比:高清电视的"码率自适应"

Netflix 和 YouTube 会根据你的网络质量自动调整视频码率:网速好时推 4K、网速差时降到 720p——这和光通信的"灵活速率"思路一模一样。链路 OSNR 高时跑 DP-64QAM(800G),OSNR 下降时自动切到 DP-16QAM(400G)甚至 DP-QPSK(200G),保持链路稳定传输不中断。

3.5 解调——如何把光变回电比特

3.5.1 直接检测(Direct Detection, DD)

最简单的解调方式:一个光电二极管(Photodiode, PD)将入射光子转化为电流,电流幅度正比于入射光强 |E|²。

核心公式 ⑬:直接检测输出
IPD(t) ∝ |E(t)|² = A²(t)
光电二极管只输出振幅的平方——完全丢失相位 φ 和偏振 ê 信息!

所以 DD 只能解调强度调制信号:OOK、PAM4、以及少数特殊形式(如 DMT)。它解调不了 BPSK、QPSK、QAM 这些相位载信信号——这就是为什么 100G 以上的长距传输必须采用相干检测

3.5.2 相干检测(Coherent Detection)

相干检测是现代高速光通信的核心技术。核心思路是:在接收端引入一束参考光(本地振荡激光,Local Oscillator, LO),让信号光与 LO 光"拍频"干涉,从而把信号的振幅和相位信息"搬移"到电信号上

相干接收机:从光域到数字域的全链路 Signal In (DP-16QAM) PBS 偏振分离 X-pol Y-pol 本地 LO 窄线宽激光器 PBS 90° Hybrid X-pol (混频 I/Q) 90° Hybrid Y-pol PDs ADC ×4 (采样) DSP • CD 补偿 • PMD 均衡 • 载波恢复 • 时钟恢复 • 偏振解复用 • 符号判决 • FEC 译码 数字比特流 0110 1001 1100...

图 3-7:相干接收机的完整架构。PBS 分离偏振,90° Hybrid 与 LO 混频获取 I/Q 分量,ADC 采样后由 DSP 完成全部均衡、补偿和判决。

相干检测的工作流程:

  1. 偏振分离(PBS):将接收光分离为 X、Y 两路偏振;
  2. 90° 光混合器(Hybrid):让信号光与 LO 光在 4 个相位差(0°, 90°, 180°, 270°)下干涉;
  3. 平衡光电探测:输出 4 路基带电信号(X-I, X-Q, Y-I, Y-Q);
  4. ADC 数字化采样:典型采样率为 2× 符号率;
  5. 数字信号处理(DSP):这是魔法发生的地方——
💡 相干 DSP 能够在电域内完成这些事情:
  • 色度色散补偿:数千 ps/nm 的 CD 可被完全数字补偿,彻底取代了传统的 DCF 色散补偿光纤
  • PMD 动态均衡:跟踪光纤偏振态的时变漂移;
  • 偏振解复用:把 X/Y 两路信号正确地分开;
  • 载波相位恢复:扣除激光器相位噪声;
  • 非线性补偿:先进 DSP 甚至可以部分抵消光纤非线性损伤;
  • FEC 译码:结合 SD-FEC 软判决纠错,把工作 SNR 向香农极限逼近 1 dB 以内。
💡 魔法解密:DSP 与主动降噪耳机 (ANC)

相干 DSP 是如何在电域里"抵消"掉光纤数千公里积累的物理色散的?听起来像魔法,但其核心逻辑与我们常用的主动降噪耳机 (Active Noise Cancellation) 非常相似。

降噪耳机听取外界环境噪音,然后经过芯片计算,播放一段与噪音波形完全相反(相位差 180°)的声波,两者在你的耳朵里互相抵消,世界就安静了。相干 DSP 做的事情如出一辙:光信号在光纤中因为色散(CD)变得面目全非,但色散的物理演化过程是确定且可被数学精确描述的。DSP 只需要在数字域里构建一个与光纤色散特性完全相反的"反向数学滤波器",让受损的数字信号穿过这个滤波器,所有的变形就会被奇迹般地"反向抵消",完美还原出原本锐利的脉冲!

现实中的相干光模块:一张能运行 DSP 的"小板子"

今天,相干检测不再是昂贵的机柜级设备——它已经被封装成可热插拔的 QSFP-DD / OSFP 光模块,大小和一颗巧克力差不多:

400G ZR
短距 DCI
📏 距离:≤120 km
🎛️ 调制:DP-16QAM
🔋 功耗:≤15 W
📐 封装:QSFP-DD
OIF 标准,用于数据中心之间的点到点互联,取代传统 10×40G/4×100G 灰光。
400G ZR+
城域网
📏 距离:≤1000 km
🎛️ 调制:DP-16QAM+PCS
🔋 功耗:≤21 W
📐 封装:QSFP-DD / CFP2
OpenZR+ MSA,支持可调谐波长、FEC 增强,可直接插到路由器端口实现 IP+Optical 融合。
800G ZR/ZR+
下一代主力
📏 距离:≤120 / ≤1500 km
🎛️ 调制:DP-16/64QAM+PCS
🔋 功耗:≤25 W
📐 封装:QSFP-DD800 / OSFP
基于 130+ Gbaud DSP ASIC(如 Cisco 7nm),2024–2026 年规模商用,AI 数据中心互联主流。
1.6T(研发)
前沿
📏 距离:≤80 km (短距)
🎛️ 调制:DP-64/256QAM+PCS
🔋 功耗:~30+ W
📐 封装:OSFP-XD
采用 ~200 Gbaud 波特率,需要 3 nm DSP 工艺,预计 2026+ 进入样品与小规模部署。
一个惊人对比:从机柜到模块

2010 年的第一代 100G 长途相干系统是整个机柜,功耗 >400 W、成本百万美元级;今天的 400G ZR+ 模块只有一支笔那么大,功耗 20 W 左右、成本降到千美元级。短短 14 年,单位比特的功耗和成本下降了三个数量级——这就是 CMOS 工艺 × DSP 算法 × 硅光子集成共同创造的奇迹。

正是这套"光域采集 + 数字域处理"的架构,让 100G/400G/800G 相干光系统成为可能。可以毫不夸张地说:现代光通信的 99% 智慧都在 DSP 里

3.5.3 前向纠错(FEC)——最后的信号守护神

即使调制、解调、DSP 都已经做到最优,信道中的随机噪声仍会造成误码。前向纠错(Forward Error Correction, FEC)在发送端为数据加入冗余校验位,让接收端能够检测并纠正一定数量的错误——无需重传。

FEC 类型开销典型算法编码增益应用
HD-FEC(硬判决)~7%RS(255,239), BCH5–6 dB传统 10G/40G 长距
SD-FEC(软判决)15–25%LDPC, Turbo, oFEC9–11 dB现代 100G+ 相干
cFEC / oFEC~15%级联软判决10–11.5 dB400G/800G ZR/ZR+
核心公式 ⑭:净荷速率 = 原始速率 × (1 − FEC 开销)
Rnet = Rline × (1 − OHFEC − OH框架)
例:64 Gbaud DP-16QAM,Rline = 512 Gb/s,总开销 ~20% → Rnet ≈ 400 Gb/s。
类比:信件的"重要单词重写三遍"

如果你寄一封手写信件,担心某些字会被水弄糊,你可能会把关键单词重写三遍——即使两遍被糊掉,第三遍能让收件人恢复原意。FEC 就是这种"冗余备份"的数学版本——它不是简单重复,而是通过精妙的代数结构,让少量冗余就能纠正更多错误。SD-FEC 让现代光系统以比经典香农公式预测更低的 SNR 工作,逼近 Shannon 理论极限

⚠️ 工程师必知的“FEC 悬崖 (FEC Cliff)”效应

在没有 FEC 的老式系统中,随着光纤变长、信噪比下降,误码率是缓缓上升的(画面慢慢变模糊)。但加入了强力的 SD-FEC 后,系统行为发生了根本变化:

  • 当 SNR 高于某个临界阈值时,FEC 能够把成千上万的误码瞬间纠正为 0,系统运行极其完美(Post-FEC BER = 0)。
  • 但当 SNR 哪怕只跌破阈值 0.1 dB,FEC 算法就会突然崩溃,纠错能力瞬间失效,链路直接中断——这就像一脚踩空掉下悬崖。

工程启示:在部署 400G/800G 系统时,你不能看业务“现在是不是通的”,而必须监控 Pre-FEC BER(纠错前误码率),确保它距离“悬崖边缘”留有足够的安全裕量(Margin)。

3.6 模块回顾与承上启下
🎯 模块三:8 个核心要点
  • 光波有四个可调制维度:振幅、频率、相位、偏振。现代高阶调制同时榨取其中三个(频率留给 DWDM)。
  • OOK + 直接检测是最简单但也最浪费的方式——频谱效率 1 bit/s/Hz,只能用振幅维度。
  • PAM4 是数据中心短距的主力——保持直接检测的简单性,同时把频谱效率翻倍到 2 bit/s/Hz。
  • PSK/QAM 必须用相干检测——它们在相位上编码信息,没有 LO 参考就无法恢复。
  • I/Q 分解是相干调制的数学基础——任何振幅+相位组合都可表示为 I、Q 两个正交分量。
  • DP-QPSK/16QAM/64QAM 构成了现代 100G/400G/800G 系统的基石——每符号 4/8/12 bits。
  • 香农极限设定了容量天花板——SNR 每加 3dB 只换回 1 bit/s/Hz,高阶调制的代价极其陡峭。
  • DSP + SD-FEC 是现代光通信的灵魂——色散补偿、PMD 均衡、载波恢复、纠错全部在数字域完成,逼近香农极限。

回到开篇的问题:"如果直接检测无法获取相位,那么相干检测怎么实现?调制阶数越高,频谱效率越高,代价是什么?"

✓ 相干检测通过引入本地振荡激光(LO),让信号光与 LO 光干涉,把振幅和相位信息"投影"到 I/Q 两个维度的电信号上,再由 DSP 完成后续处理。
✓ 调制阶数越高,星座图中的点越密集,最小欧氏距离 dmin 越小,对 SNR 的要求越苛刻。工程上,频谱效率翻倍大约需要 6–7 dB 的 SNR 提升——这就是 Shannon 公式 C=B·log₂(1+SNR) 的残酷现实。

常见误解与陷阱 Common Misconceptions

学习光通信时,有些概念非常容易"想当然"——即便是从业多年的工程师,也偶尔会栽在这些陷阱里。本节列举最常见的几个误区,帮你建立更精确的心智模型

❌ 误解 #1
"光在光纤里以光速传播"
✓ 更准确地说:光在纤芯中以 c/n ≈ 2×10⁸ m/s 传播,比真空光速慢约 33%。这就是为什么一根 10,000 km 的跨洋光缆端到端延迟约 50 ms,而非理论极限的 33 ms。
重要推论:在金融高频交易、跨区 AI 训练等场景中,这 17 ms 的差距是致命的——这也催生了"空心光纤(Hollow-Core Fiber)"研究,让光以接近真空速度在特殊结构中传播。
❌ 误解 #2
"带宽越大一定越好"
✓ 真相:根据香农公式 C = B·log₂(1+SNR),盲目扩展 B 时,若 SNR 随之下降(因为 信号总功率分摊到更宽频谱),总容量 C 可能反而降低。
工程洞察:这就是为什么 DWDM 系统有一个"最优信道功率"——超过它不仅非线性损伤爆发,还会因为整体 OSNR 下降而得不偿失。
❌ 误解 #3
"色散是坏东西,越少越好"
✓ 真相:在单通道系统中色散确实是坏事。但在 DWDM 多波长系统中,适度色散反而能抑制四波混频(FWM)——这就是 G.655 非零色散位移光纤(NZ-DSF)的设计哲学:故意保留 ~4 ps/(nm·km) 的色散。
深层原因:FWM 需要"相位匹配"才能高效发生,色散恰恰破坏相位匹配。"恰到好处的不完美"胜于"完美"。
❌ 误解 #4
"相干检测比直接检测好"
✓ 更准确:两者是不同场景的最优选择,不是"好坏"关系。
相干:灵敏度高、可补偿色散/PMD、支持高阶 QAM——长距骨干与城域首选;但成本高、功耗大(LO + DSP ASIC)。
直接检测:成本/功耗低、对 LO 线宽无要求、延迟极低——数据中心 <10 km、800G DR8/FR8 仍是 PAM4 + DD 的天下。
决定性因素:距离 × 成本 × 功耗预算 的三角权衡。
❌ 误解 #5
"单模光纤里只有一条光"
✓ 真相:"单模"是指只有一个空间模式(LP₀₁),但这个模式包含两个正交偏振态(HE₁₁ˣ 和 HE₁₁ʸ)——这正是 DP-QPSK/16QAM "双偏振"复用的物理基础。
术语警惕:"单模"≠"单路信号"。严格来说"单模光纤"只是"单空间模",偏振维度仍可利用。
❌ 误解 #6
"EDFA 是'免费'的放大器"
✓ 真相:EDFA 放大的同时会引入 ASE 噪声(Amplified Spontaneous Emission),每级放大都在消耗 OSNR。典型理论噪声系数 NF ≈ 3 dB,实际 5–7 dB。
系统后果:多级 EDFA 级联时,OSNR 按 10·log(N) 恶化。跨洋系统需要极低 NF 的高端 EDFA + 分布式拉曼放大 + 先进 FEC 共同救场。

理解自测 Check Your Understanding

下列 10 个问题覆盖本文核心概念。先不看答案,独立思考 5–10 分钟,再展开对照——这是建立长期记忆的最佳方式。

Q1 · 为什么光通信选择 1550 nm 而不是可见光?
两个原因:(a) 1550 nm 处于二氧化硅光纤衰减最低点(~0.20 dB/km),是瑞利散射与红外吸收的交汇"谷底";(b) 1550 nm 恰好与掺铒光纤放大器(EDFA)增益窗口重合,可实现全光放大。这两者让长距离无电中继传输成为可能。
Q2 · 全内反射发生的两个必要条件是什么?
① 光必须从高折射率介质射向低折射率介质(即 n₁ > n₂,所以纤芯折射率必须高于包层);② 入射角 θ₁ 必须大于或等于临界角 θ_c = arcsin(n₂/n₁)。两个条件同时满足,光才会被 100% 反射回纤芯。
Q3 · V 参数 = 2.405 的物理意义是什么?
V = 2.405 是光纤单模与多模的分界点(精确值 = 第一个 Bessel 函数零点)。V < 2.405 时,只有基模 LP₀₁ 能在光纤中稳定传播——即单模条件。V 可通过 V = (2πa/λ)·NA 控制:想得到单模,就需要小纤芯、低 NA、或长波长。
Q4 · 为什么 100G 及以上的长距系统必须用相干检测?
100G+ 系统普遍使用 DP-QPSK、DP-16QAM 等"相位编码"调制格式。直接检测(Direct Detection)的光电二极管只输出 |E|²,相位和偏振信息完全丢失,无法解调这些格式。相干检测通过引入本地振荡激光(LO),让信号光与 LO 光拍频干涉,把振幅、相位、偏振三个维度的信息都"搬"到电信号上,再由 DSP 恢复原始比特。
Q5 · 香农公式 C = B·log₂(1+SNR) 对光通信意味着什么"残酷的现实"?
SNR 每翻倍(+3 dB)只能换来 1 bit/s/Hz 的频谱效率提升——这是对数级的回报递减。从 DP-QPSK (4 bit/s/Hz) 升级到 DP-16QAM (8 bit/s/Hz) 需要 SNR 提升约 6–7 dB,等价于传输距离缩短到 1/4。这就是"速率 × 距离"永恒权衡的数学根源。
Q6 · 色散会让脉冲展宽,但现代相干系统传输 1000 km 仍能正常工作——为什么?
因为现代相干系统的色散补偿完全在数字域由 DSP 完成。DSP 在电域实现一个频响与光纤色散完全相反的数字滤波器,可以完整补偿数万 ps/nm 的累积 CD——这让传统的 DCF 色散补偿光纤变得不再必要,极大简化了链路设计,同时省掉 EDFA 的额外噪声。
Q7 · DP-16QAM @ 64 Gbaud 为什么对应 400G 净荷而不是 512G?
原始线速率 = 64 Gbaud × 4 bit/symbol × 2 偏振 = 512 Gb/s。但现代系统必须开销约 15–25% 用于 SD-FEC(软判决前向纠错)以及 OTN 帧结构等。扣除后净荷速率 ≈ 400 Gb/s。FEC 开销不是浪费——它让系统能以更低的 SNR 工作,总体等效于"用频谱换距离"。
Q8 · 为什么 DWDM 系统需要在 C 波段用"非零色散"光纤(G.655)?
看似反直觉,但"小量色散"实际上能抑制非线性效应——特别是四波混频(FWM)。当 DWDM 信道等间距且色散为零时,不同信道之间的相位匹配条件容易满足,FWM 会产生严重的串扰。非零色散会"打乱"这种相位匹配,让 FWM 功率大幅降低。这是工程中"恰到好处的不完美"的经典案例。
Q9 · 模拟信号和数字信号在长距传输中最本质的区别是什么?
数字信号可以被完美再生——在每一级中继点,只需判断信号是更接近 0 还是 1,然后重新生成一个干净的新信号,噪声不累积。模拟信号无论怎么放大,噪声都会与信号一起被放大,失真不可逆。这是通信史上最重要的架构决策——所有现代通信(光、无线、有线)都是数字的。
Q10 · 如果未来光通信要继续扩容,最可能的突破方向是什么?
Shannon 公式已经逼近极限,单波长容量天花板在 1.6T 左右。未来扩容的三条主要路径:
空间复用 SDM(多芯光纤、少模光纤)——在"空间"维度打开新通道;
扩展波段(L-band、S-band、甚至 O+E+S+C+L+U 全波段)——更多的波长空间;
CPO / 光 I/O——把光引擎直接集成到交换 ASIC 旁,降低功耗和延迟,支撑 AI 数据中心 1.6T/3.2T 接口。
这些都将在 Optical 202 模块详细展开。

公式速查 Formula Index

本文涉及的核心公式按出现顺序索引如下。每条公式旁有跳转链接,方便回到原文查看完整推导。

电磁波速度
c = 1 / √(μ₀ε₀) ≈ 3 × 10⁸ m/s
→ §1.1
波长-频率关系
c = λ × f
→ §1.1
光子能量
E = h × f = h × c / λ
→ §1.1
香农信道容量
C = B × log₂(1 + SNR)
→ §1.3
④′
香农熵
H(X) = −Σᵢ p(xᵢ) · log₂ p(xᵢ)
→ §1.3
分贝定义
dB = −10 × log₁₀(P_out / P_in)
→ §1.5
分贝毫瓦
P(dBm) = 10 × log₁₀(P / 1 mW)
→ §1.5
Snell 定律 · 临界角 · NA
n₁ sin θ₁ = n₂ sin θ₂  |  sin θc = n₂/n₁  |  NA = √(n₁²−n₂²)
→ §2.2
V 参数(单模条件)
V = (2πa/λ) × NA   ;  V < 2.405 → 单模
→ §2.3
衰减 · 色散展宽
P_out = P_in × 10⁻ᵅᴸ/¹⁰  |  Δτ = |D| × Δλ × L
→ §2.4–§2.5
光波完整表达
E(t) = A · cos(2π·f·t + φ) · ê
→ §3.1
I/Q 分解
s(t) = I · cos(2πft) − Q · sin(2πft)
→ §3.3.3
傅里叶变换
S(f) = ∫ s(t) · e⁻ʲ²πᶠᵗ dt
→ §3.4.1
奈奎斯特最小带宽
B_min = R_s / 2
→ §3.4.2
频谱效率
SE = log₂(1 + SNR) (bit/s/Hz)
→ §3.4.3
误码率 vs d_min
BER ∝ Q( d_min / (2σ) )
→ §3.4.4
直接检测
I_PD(t) ∝ |E(t)|² = A²(t)
→ §3.5.1
净荷速率
R_net = R_line × (1 − OH_FEC − OH_framing)
→ §3.5.3

旅程的第一站,结束于此

我们从一个简单的问题开始——为什么要用光来传输信息?
沿着麦克斯韦方程、香农信息论、全内反射、傅里叶变换、I/Q 分解的线索,
一步步揭开了光通信最底层的三块基石:
光是最好的载体 · 光纤是最好的通道 · 相干调制是最聪明的编码

但这仅仅是个开始。当无数比特以相干光的形式在光纤中奔流不息时,
一个更宏大的问题摆在我们面前:
如何让一根光纤同时承载几十、几百个独立信号?如何让这些信号
跨越大陆、跨越海洋,构建起全球的神经网络?

术语表 Glossary

本文涉及的核心术语按字母顺序整理如下,供快速查阅。

术语 英文全称 / 缩写 简要释义
比特 Bit 信息的最小单位,取值 0 或 1。1 bit 代表消除 2 倍不确定性所需的信息量。
带宽 Bandwidth (B) 信道能通过的频率范围,单位 Hz。决定单位时间能传输的信号量上限。
误码率 BER, Bit Error Rate 接收端错误比特数与总传输比特数之比。典型要求 < 10⁻¹² (FEC 后)。
BPSK Binary Phase Shift Keying 二进制相位键控。用 0 和 π 两个相位表示 1 bit。
C-Band Conventional Band 1530–1565 nm 波段,光纤衰减最低、EDFA 增益最平坦,DWDM 主力窗口。
色度色散 CD, Chromatic Dispersion 不同波长传播速度不同导致的脉冲展宽。SMF @1550nm ≈ 17 ps/(nm·km)。
相干检测 Coherent Detection 引入本地振荡激光与信号光混频,恢复振幅+相位+偏振完整信息。
星座图 Constellation Diagram 调制符号在 I/Q 复平面的分布图。点数 = 2^(每符号比特数)。
dB / dBm Decibel / Decibel-milliwatt 对数功率单位。dB 为相对量(功率比),dBm 为绝对量(相对于 1 mW)。
直接检测 DD, Direct Detection 光电二极管直接输出 |E|²,仅能解调强度调制信号。
色散 Dispersion 脉冲在光纤中展宽的总称,含模间色散、CD、PMD 三类。
DSP Digital Signal Processing 数字信号处理。现代相干收发机在电域完成色散/偏振/载波恢复等关键功能。
DWDM Dense Wavelength Division Multiplexing 密集波分复用。一根光纤同时传输数十至上百个波长信号。(模块六详讲)
EDFA Erbium-Doped Fiber Amplifier 掺铒光纤放大器。C-Band 信号全光放大器件,跨洋通信的基石。
FEC Forward Error Correction 前向纠错。加入冗余位使接收端自纠错,无需重传。
傅里叶变换 Fourier Transform 时域与频域互相转换的数学工具。光通信频谱分析的基础。
I/Q 分解 In-phase / Quadrature 正弦波分解为 cos 和 sin 两个正交分量。相干调制的数学表示。
码间干扰 ISI, Inter-Symbol Interference 脉冲展宽至相邻符号区间造成的干扰。色散的主要危害。
LO Local Oscillator 本地振荡激光。相干接收机的参考光源,决定系统相位噪声底。
多模光纤 MMF, Multi-Mode Fiber 纤芯粗(50/62.5 μm),支持多个模式传播。适合短距、数据中心内部。
数值孔径 NA, Numerical Aperture NA = √(n₁²−n₂²)。光纤接受光的最大锥角,衡量集光能力。
NRZ / RZ Non-/Return-to-Zero OOK 的两种波形。NRZ 不回零、RZ 每符号中间回零。
奈奎斯特带宽 Nyquist Bandwidth Bmin = Rs/2。无 ISI 传输所需最小带宽。
OOK On-Off Keying 开关键控。最简单的光调制方式:有光=1,无光=0。
OSNR Optical Signal-to-Noise Ratio 光信号与光噪声(主要来自 EDFA ASE)的功率比。相干系统关键指标。
PAM4 4-Level Pulse Amplitude Modulation 4 电平脉冲振幅调制。数据中心 400G/800G 短距主流。
光子 Photon 光的量子化单位。能量 E = hf。光通信信噪比的最终量子极限。
偏振模色散 PMD, Polarization Mode Dispersion 两正交偏振态传播速度差引起的随机脉冲展宽。现代光纤 ≤ 0.1 ps/√km。
QAM Quadrature Amplitude Modulation 正交振幅调制。同时调制 I/Q 两路,实现高频谱效率(16/64/256QAM)。
QPSK Quadrature Phase Shift Keying 四相位键控,4 个相位代表 2 bits。相干系统 100G 基础格式。
瑞利散射 Rayleigh Scattering 光纤微观密度涨落引起的散射损耗,强度 ∝ 1/λ⁴。长波长衰减更低的根源。
折射率 Refractive Index (n) n = c/v。光在介质中相对真空的速度比。SiO₂ 玻璃 n ≈ 1.46–1.47。
香农公式 Shannon Formula C = B·log₂(1+SNR)。信道容量的理论极限,光通信的"天花板"。
单模光纤 SMF, Single-Mode Fiber 纤芯细(~9 μm),仅基模传播,消除模间色散。长距通信首选。
信噪比 SNR, Signal-to-Noise Ratio 信号功率与噪声功率之比。决定调制阶数与距离的核心指标。
Snell 定律 Snell's Law n₁ sin θ₁ = n₂ sin θ₂。光在界面折射的基本定律。
波特率 Symbol Rate (Rs) 每秒传输的符号数,单位 Baud。比特率 = Rs × 每符号比特数。
全内反射 TIR, Total Internal Reflection 入射角大于临界角时光 100% 反射回高折射率介质。光纤导光的物理基石。
V 参数 V-Number V = (2πa/λ)·NA。V < 2.405 为单模光纤临界条件。
波长 Wavelength (λ) λ = c/f。光通信主要工作于 1260–1625 nm 近红外窗口。