光通信基础：从光子到比特的旅程

Module 01 of 03

光与信息的基础

一切从「为什么用光来传输信息？」这个最根本的问题开始。我们将回到麦克斯韦方程、香农信息论，从第一性原理理解光作为信息载体的独特优势。

如果要把一条消息传递到 10,000 公里之外——比如从东京到纽约——你会选择什么方式？电信号？无线电波？光？为什么？

提示：想想哪种方式能同时满足「快」「多」「远」三个需求。

这是整个光通信大厦的地基问题。在展开任何技术细节之前，我们必须先理解两件事：光到底是什么，以及信息到底是什么。只有当这两个概念在你脑中清晰了，后面的光纤、调制、DWDM 才会像乐高积木一样自然地搭建起来。

1.1 光的本质：从麦克斯韦到波粒二象性

Why — 为什么要从光的本质开始？

因为光通信的一切优势——超大带宽、超低损耗、抗电磁干扰——都不是工程师凭空设计出来的，而是光的物理本质所决定的。如果不理解光为什么有这些特性，你就只能死记参数，而无法在面对新技术时做出独立判断。

What — 光是电磁波

1865 年，麦克斯韦完成了物理学史上最伟大的统一之一：他用四个方程将电场和磁场统一了起来，并且预言了电磁波的存在。更令人震惊的是，他计算出电磁波在真空中的传播速度恰好等于已测定的光速——于是他大胆宣称：光就是电磁波。

核心公式 ①：电磁波速度

c = 1 / √(μ₀ε₀) ≈ 3 × 10⁸ m/s

μ₀ = 真空磁导率，ε₀ = 真空介电常数。这个常数不依赖于任何波源的性质——它是时空本身的属性。

类比：池塘里的涟漪

把一颗石子扔进平静的池塘，水面会形成同心圆的波纹向外扩散。电磁波的传播类似——只不过「扰动」的不是水面，而是电场和磁场。电场的变化激发磁场，磁场的变化又反过来激发电场，两者互相推动，像两个人交替跑接力赛一样，把能量传递到远方，而且根本不需要介质。

所有的电磁波——无线电波、微波、红外线、可见光、紫外线、X射线、伽马射线——本质上都是同一种东西，区别只在于频率（或等价地说，波长）。

核心公式 ②：波长-频率关系

c = λ × f

λ（lambda）= 波长（m），f = 频率（Hz）。波长越短，频率越高，单个光子携带的能量越大。

图 1-1：电磁波谱全景。光通信使用的近红外波段位于可见光与红外线之间。

光通信并没有使用我们肉眼能看到的可见光（约 380–780 nm），而是选择了近红外区域（约 1260–1625 nm）。为什么？这个问题的答案藏在光纤的材料特性中——我们将在模块二详细揭晓。

How — 光的波粒二象性

光还有另一面：量子性。1905 年，爱因斯坦提出光不仅是波，还是一个一个的能量包——光子（photon）。每个光子的能量由频率决定：

核心公式 ③：光子能量

E = h × f = h × c / λ

h = 6.626 × 10⁻³⁴ J·s（普朗克常数）。1550 nm 光子的能量约 0.8 eV —— 极其微小，这正是光纤通信低功耗的物理基础之一。

类比：海浪与水滴

想象你站在海边：远观大海，你看到的是连绵的波浪（波动性）；蹲下来细看，你会发现每一朵浪花都是由无数离散的水滴组成的（粒子性）。光也是一样——宏观上它呈现波动行为（干涉、衍射），微观上它以一个个光子的方式被发射和吸收。光通信系统的发射端（激光器）利用的是受激辐射——一种量子行为；传输过程（光纤）用的是经典波动光学；接收端（光电探测器）又回到了光子的粒子性——光电效应。

既然所有电磁波的速度都一样（光速），为什么我们选择光（近红外），而不用无线电波来做长距离大容量通信呢？

提示：想想频率差异意味着什么——可用带宽有多大？

答案的核心在于：光的频率约为 200 THz（10¹⁴ Hz），比无线电波（10⁶ – 10⁹ Hz）高出五到八个数量级。根据通信理论，载波频率越高，可供调制的带宽就越大，能承载的信息量就越多。这就像一条八车道的高速公路比一条乡间小路能运载更多车辆一样。这是光通信最根本的物理优势。

1.2 黄金波段：为什么是 1310 nm 和 1550 nm？

Why — 不是所有光都适合通信

虽然理论上任何频率的光都可以携带信息，但实际工程中，光纤材料（二氧化硅 SiO₂）对不同波长的光有不同的吸收和散射特性。就像不同频率的声音在水下传播衰减不同一样，光在光纤中也有「衰减曲线」。

图 1-2：标准单模光纤 (G.652) 衰减随波长的变化曲线。1310 nm 和 1550 nm 附近是两个关键的低损耗窗口。

What — 两个黄金窗口

经过数十年的材料科学和制造工艺优化，光纤在两个波长区域达到了最低衰减：

波段名称	中心波长	典型衰减	色散特性	主要应用
O-band	1310 nm	~0.35 dB/km	零色散附近	短距/企业网、数据中心互联
C-band	1550 nm	~0.20 dB/km	有色散（可管理）	长途骨干网、海缆、DWDM 系统

1550 nm（C-band）之所以成为长距离通信的绝对主力，原因是双重的：它不仅衰减最低，而且恰好处于掺铒光纤放大器（EDFA）的增益窗口——这意味着信号在传输过程中可以被光学放大而无需转换为电信号。这个巧合般的物理事实，彻底改变了全球通信网络的架构。

类比：选择最佳飞行高度

飞机在不同高度飞行时，空气阻力和燃油效率都不同。民航客机选择在 10,000 米左右巡航，因为那个高度是「阻力最小、效率最高」的甜蜜点。光通信选择 1550 nm 也是同样的道理——那是光在二氧化硅光纤中「阻力最小」的波长。

💡 物理奇迹：EDFA 是如何“全光放大”的？

在 EDFA 发明前，光信号每跑几十公里，就必须先变成电信号、放大、再重新用激光器发光（O-E-O 转换），成本极其高昂。EDFA 打破了这个规则。

类比：水上滑板的接力推手。想象信号光子是失去速度的滑板选手。我们在光纤中掺入“铒 (Er) ”离子，并用一束 980 nm 的高能“泵浦光”照射它们，把铒离子激发到高能态（就像给沿途的推手喂饱了能量）。当疲惫的 1550 nm 信号光子经过时，会触发“受激辐射”——高能态的铒离子瞬间释放能量，产生一个与原光子频率、相位、方向完全相同的新光子。一个光子进去，两个光子出来；两个变四个... 信号就这样在纯光域被完美放大了！

🚀 2026 工业界前沿：从 C 波段向 C+L 波段的扩展

随着全球 AI 与数据流量的爆炸，即使在 C 波段逼近了香农极限，单根光纤的容量仍面临“枯竭”。因此，现代光传输系统已全面向右扩展，启用 L 波段（Long-wavelength Band, 1565–1625 nm）。C+L 双波段系统将可用频谱从约 4.8 THz 扩展到了近 10 THz，直接让光纤的传输容量翻倍。这就像在已经满载的 8 车道高速公路旁，利用现有的地基，硬生生又开辟出了全新的 8 车道。

1.3 信息论基础：香农告诉我们什么

关键过渡：从“能量”到“信息”

到目前为止，我们讨论的都是“光如何传播能量”。但通信的本质并不是传能量，而是传“差异”。两束完全一样的光，无法携带任何信息；只有当光发生变化（强度、相位、频率），它才开始承载信息。因此，我们需要一个新的理论来回答：“变化如何被量化为信息？”——这就是信息论的角色。

一根光纤能传多少信息？有没有一个理论上的极限？如果有，是什么决定了这个极限？

提示：答案不只与光纤有关——还与信号、噪声和带宽有关。

Why — 为什么需要信息论？

光通信不仅仅是物理学——它是物理学与信息科学的交叉。1948 年，克劳德·香农（Claude Shannon）发表了划时代的论文《通信的数学理论》，为所有通信系统定义了一个不可逾越的理论上限。理解香农极限，就是理解「光通信为什么还在持续进化」的根本原因。

What — 先回答：什么是"信息"？

在展开香农公式之前，我们必须先回答一个哲学式的问题：信息到底是什么？香农给出了一个优雅到令人震惊的答案——信息是"消除不确定性"的度量。

如果一件事你完全确定会发生（例如"明天太阳会升起"），你从这个消息里得到的信息量是 0；如果一件事极其意外（例如"明天下午3点下红雪"），你得到的信息量就很大。越不可能的事件发生，信息量越大——这个直觉被香农用数学精确化了：

信息量（自信息）

I(x) = −log₂ p(x) (单位：bit)

p(x) 是事件 x 发生的概率。为什么用 log₂？因为我们想让"两个独立事件的信息量可以相加"——乘法变加法，这是对数的本质。

对整个概率分布求加权平均，就得到香农熵（Shannon Entropy）——衡量一个随机变量"平均信息量"的最核心指标：

核心公式 ④′：香农熵

H(X) = −Σᵢ p(xᵢ) · log₂ p(xᵢ) (bit/symbol)

H 越大，意味着这个信号源"越不可预测"、信息量越丰富。通信系统的根本任务就是把 H 个比特从 A 点高效搬到 B 点。

📊 三个直观例子，秒懂熵

场景	概率分布	熵 H(X)	直觉
公平硬币	P(正)=P(反)=0.5	1 bit	最不可预测
作弊硬币	P(正)=0.9, P(反)=0.1	≈ 0.47 bit	几乎知道结果
公平六面骰子	每面 1/6	≈ 2.585 bit	log₂6，不是整数
双偏振 16QAM 符号	256 个符号，等概率	8 bit	正好是 log₂256

这张表里的最后一行揭示了一个重要洞察：当所有符号等概率出现时，熵达到最大值 log₂(N)——这是 DP-16QAM 每符号 8 bits 的数学来源。但你也许会问："能不能让符号不等概率，反而更接近信道极限？" ——能！这就是模块三 §3.4.5 要介绍的 PCS 概率星座整形。

类比：20 个问题猜物品

玩过"20 questions"游戏吗？每问一个是/否问题，相当于获得 1 bit 信息。根据信息论，最优策略是每次都问能把剩余可能性"对半砍"的问题——这样 20 bits 就能区分 2²⁰ ≈ 100 万个物品。光通信做的事情本质上完全一样：用尽可能少的光功率 × 带宽，传递尽可能多的"问题答案"。

Now — 香农信道容量公式

核心公式 ④：香农信道容量

C = B × log₂(1 + SNR)

C = 信道容量（bit/s），B = 带宽（Hz），SNR = 信噪比（线性值）。
这个公式告诉我们：要提升传输速率，你只有三条路——增大带宽、提高信噪比、或者两者同时进行。

让我们拆解这个公式的每一项，理解它对光通信的深远意义：

📡

B — 带宽

光的频率约 200 THz，理论可用带宽巨大。DWDM 技术通过同时使用多个波长来并行利用这个带宽。

📊

SNR — 信噪比

更好的激光器、更灵敏的探测器、更强的 EDFA 放大器，都是在提升 SNR。高阶调制格式（如 64QAM）对 SNR 要求极高。

🧮

log₂ — 对数关系

SNR 翻倍只能增加 1 bit/s/Hz 的频谱效率。这意味着单纯提高功率回报递减——我们必须「更聪明地使用每一赫兹」。

关键问题：噪声从哪里来？

在理想世界中，信号可以无限精确。但在现实中，任何通信系统都不可避免地受到噪声影响。在光通信中，主要噪声来源包括：

放大器噪声（ASE，来自 EDFA）
光子本身的量子噪声（Shot Noise）
光纤非线性引入的噪声（Kerr 效应）

香农公式中的 SNR，本质上就是“你能否区分信号与这些噪声”。

类比：高速公路的通行能力

把带宽 B 想象成高速公路的车道数，把 SNR 想象成每条车道上允许的最高车速。香农公式告诉你：这条公路每小时最多能通过多少辆车。你可以加车道（增大带宽），也可以提高限速（提高 SNR），但道路有物理极限（非线性效应、量子噪声），不可能无限扩展。光通信过去 40 年的进化史，就是不断逼近这条公路极限的故事。

How — 光如何携带信息？

理解了「光是什么」和「信息的极限」之后，我们来回答一个最实际的问题：光到底是怎么「背」着比特在光纤里跑的？

光波有四个可以被调制（改变）的基本物理量：

物理量	调制方式	简单例子	信息密度
振幅（光的亮度）	OOK, PAM4	手电筒的开/关 = 1/0	低 → 中
频率（光的颜色）	FSK	红光 = 1，蓝光 = 0	低
相位（波的位移）	BPSK, QPSK	波峰对齐 = 0，波峰偏移半个周期 = 1	中 → 高
偏振（振动方向）	DP (双偏振)	在水平和垂直方向各传一路信号	容量翻倍

最简单的方式是OOK（On-Off Keying）——光亮代表 1，光灭代表 0。这就像你对着远处用手电筒打莫斯密码。但现代光通信系统已经远超这种简单方式：通过同时调制振幅和相位，再利用双偏振，一个符号周期就可以携带 8 个甚至更多比特。这些高级调制技术将在模块三详细展开。

1.4 模拟 vs 数字：为什么数字信号胜出

早期的电话网络使用模拟信号——声音直接被转化为连续变化的电信号。这个方式直觉上更「自然」，为什么我们最终全面转向了数字通信？

提示：想想长距离传输中，噪声对连续信号和离散信号的影响有何不同。

这是通信史上最重要的架构决策之一。答案的核心是：数字信号可以被完美地再生（regenerate），而模拟信号不行。

当模拟信号在光纤（或任何信道）中传输时，噪声会不可避免地叠加上去。每经过一个中继器放大，噪声也被放大——信号质量不可逆地恶化。而数字信号只有 0 和 1 两种状态：在每个中继点，我们只需判断「这个信号更接近 0 还是 1」，然后重新生成一个干净的新信号。这就像传话游戏中，如果每个人不是口头转述（模拟），而是把听到的话写下来再交给下一个人（数字），信息就不会失真。

图 1-3：模拟信号在逐级放大中噪声不断积累，最终不可辨识；数字信号在每级中继点可被判决再生，保持完整。

当然，数字化本身也是有代价的——你需要对模拟世界进行采样和量化。奈奎斯特定理告诉我们，采样率必须至少是信号最高频率的两倍，才能不丢失信息。这些数学基础将在模块三中详细讨论。

1.5 光通信的价值：为什么光纤改变了世界

在结束模块一之前，让我们从「价值」的角度总结光通信为什么如此重要。这不仅仅是一个技术问题——它是现代文明的基础设施。

⚡

超大容量

单根光纤已实现超过 100 Tbps 的实验室传输记录。全球互联网流量的 99% 以上通过光纤传输。

🌍

超远距离

跨洋海缆可达 10,000+ km，配合 EDFA 放大器实现无电中继传输。这是连接各大洲的唯一实用方式。

🔒

抗干扰

光纤是介质波导，不辐射电磁波，也不受外部电磁场干扰——在工厂、医院等强电磁环境中尤为重要。

🪶

轻量细巧

一根 125 μm 直径的光纤承载的信息量，相当于数千根铜缆。节省管道空间和重量。

核心公式 ⑤：分贝定义 (dB)

衰减 (dB) = −10 × log₁₀(P_out / P_in)

dB 是光通信中最常用的单位。0.2 dB/km 意味着每公里信号功率衰减约 4.5%。
100 km 后：0.2 × 100 = 20 dB → 信号功率降为原来的 1/100。

核心公式 ⑥：分贝毫瓦 (dBm)

P(dBm) = 10 × log₁₀(P / 1 mW)

dBm 是绝对功率单位。0 dBm = 1 mW。典型激光器输出约 0~+6 dBm，光电探测器灵敏度约 −20~−28 dBm。

1.5.5 百年光通信简史

如果你想理解"今天的光通信为什么是这个样子"，最好的方式是快速回顾这门学科的关键里程碑：

1865

麦克斯韦预言电磁波

四个方程统一电与磁，预言光速电磁波——光通信的理论种子。

1948

Shannon《通信的数学理论》

定义了信道容量的绝对上限 C=B·log₂(1+SNR)，至今仍是光通信的"圣经"。

1960

Maiman 发明激光器

首次实现受激辐射，为光通信提供了相干、单色、高强度的光源。

1966

高锟提出低损耗光纤构想

预言玻璃纤维可实现 <20 dB/km 损耗——被誉为"光纤之父"，2009 年获诺贝尔物理学奖。

1970

康宁造出 20 dB/km 光纤

Corning 首次制出满足通信要求的超低损耗光纤，光通信商业化正式起步。

1987

EDFA 发明

掺铒光纤放大器让 C-Band 全光放大成为可能，跨洋无电中继传输时代开启。

1995

DWDM 商用化

一根光纤同时承载数十个波长，容量指数级增长，成为互联网骨干网的关键基础设施。

2010

100G 相干传输商用

DP-QPSK + 相干 DSP 成为长途骨干标准，彻底终结传统 DCF 色散补偿架构。

2020

400G ZR / 800G 问世

可插拔相干光模块 (QSFP-DD) 进入城域与数据中心互联（DCI），路由光网络融合时代到来。

2024+

CPO / 硅光子 / AI 原生光网络

共封装光学 (CPO) 将光引擎直接集成在交换 ASIC 旁；硅光子驱动光 I/O；AI 数据中心对光通信提出全新需求。

观察：从 Shannon 到 100G 相干花了 62 年；从 100G 到 800G 只用了 10 年。光通信的加速度正在提升——这也是为什么今天学习光通信原理比任何时候都更有价值。

1.6 模块一回顾：核心要点

🎯 模块一：7 个核心要点

光是电磁波——麦克斯韦方程统一了光学与电磁学。光速 c = 1/√(μ₀ε₀) 是时空本身的属性。
光具有波粒二象性——波动性决定了传输行为（衍射、折射），粒子性（光子）决定了发射与探测行为。E = hf。
光的频率极高（~200 THz）——这赋予了它远超微波/射频的可用带宽，是大容量通信的物理基础。
1310 nm 和 1550 nm 是黄金波段——由二氧化硅光纤的衰减特性决定。C-band（1550 nm）衰减最低且与 EDFA 增益窗口重合。
香农公式 C = B log₂(1+SNR)——定义了通信系统的理论极限。光通信的进化就是不断逼近这个极限。
光的振幅、频率、相位、偏振都可以携带信息——从简单的 OOK 到复杂的 DP-16QAM，本质都是调制这四个物理量。
数字通信胜出的根本原因是信号可再生——克服了模拟通信中噪声积累不可逆的致命缺陷。

反思：光在光纤中传输时，0.2 dB/km 看起来很小，但传输 100 km 就衰减了 20 dB（功率降为 1%）。那么，有没有办法在传输途中把光信号「放大」回来，而不需要先转成电信号？如果可以，这会对整个网络架构产生什么影响？

→ 这个问题将在模块二中通过 EDFA（掺铒光纤放大器）得到解答。

Module 2

光纤——光的高速公路

Optical Fiber — The Highway of Light

📐 5+ 核心公式 📖 约 3 500 字 🔑 8 个核心要点

🤔 模块引导问题
模块一告诉我们：光是携带信息的最佳载体。
但光在自由空间中会发散、被大气吸收和散射。我们如何把一束光"关"在一根比头发丝还细的玻璃丝里，并让它跑上数千公里不"逃跑"？
答案就是全内反射 (Total Internal Reflection)——光纤通信最核心的物理原理。

§2.1 光纤的结构与制造

🤔 思考
一根直径只有 125 µm（约人类头发的直径）的玻璃丝，为什么能在数十年里承载全球 95% 以上的数据流量？它的内部构造到底有什么精巧之处？

三层同心圆结构

光纤（Optical Fiber）的横截面由三层同心圆组成，从内到外分别是：

纤芯 (Core)：掺锗（GeO₂）的高纯度 SiO₂ 玻璃，折射率较高（n₁ ≈ 1.468）。光信号就在这里传播。
包层 (Cladding)：纯 SiO₂ 玻璃，折射率较低（n₂ ≈ 1.465）。它与纤芯形成折射率差，让全内反射成为可能。
涂覆层 (Coating / Buffer)：丙烯酸酯等聚合物保护层，抵御机械应力和微弯。

图 2-1 光纤的横截面与纵截面结构。单模光纤 (SMF) 纤芯直径约 9 µm，包层 125 µm，涂覆层 250 µm。

💡 生活类比 — 水管
把光纤想象成一根水管：纤芯是管道的空心部分，水（光）在里面流；包层是管壁，把水"约束"在管内；涂覆层则是管外的保温层，用来保护管壁不受外力破坏。

制造工艺：预制棒 + 拉丝

光纤的制造分为两大步骤：

制造预制棒（Preform）：先用化学气相沉积法（MCVD / OVD / VAD 等工艺），在高温下将极纯的气态硅化物沉积成一根约 1 米长、直径数厘米的玻璃棒。这根棒的截面结构就是光纤的"放大版"——中心是高折射率的纤芯材料，外围是低折射率的包层材料。
拉丝（Drawing）：把预制棒放进拉丝塔顶部的高温炉中（约 2000°C），玻璃软化后靠重力自然下垂，在精密控制下被拉成直径仅 125 微米（µm） 的光纤——比人的头发（约 50µm）粗不了多少。拉丝速度可达每秒数十米，一根预制棒可以拉出几百公里的光纤。

拉出的光纤立即被涂上一层保护性的丙烯酸酯涂覆层（Coating），使总直径达到约 245µm，以保护脆弱的玻璃不受划伤和潮气侵蚀。

▼ 为什么光能被"关"在玻璃里？ ▼

§2.2 全内反射——光纤的物理基石

🤔 思考
当你潜入泳池底部向上看水面时，会发现超过一定角度后水面变成了一面"镜子"，看不到外面的世界——这就是全内反射。那么，全内反射发生的条件到底是什么？为什么纤芯折射率一定要大于包层？

折射率 (Refractive Index)

当光从真空进入介质，速度会变慢。折射率定义为：

折射率定义 n = c / v c 为真空光速 ≈ 3×10⁸ m/s；v 为光在介质中的速度。SiO₂ 玻璃 n ≈ 1.46–1.47。

Snell 定律

光在两种折射率不同的介质界面发生折射，入射角 θ₁ 与折射角 θ₂ 满足：

Snell 定律 (Snell's Law) n₁ sin θ₁ = n₂ sin θ₂ 角度均相对于界面法线。n₁ > n₂ 时光从光密介质射向光疏介质。

临界角与全内反射

当 n₁ > n₂（光从纤芯射向包层），随着入射角 θ₁ 增大，折射角 θ₂ 趋向 90°。令 θ₂ = 90° 即得临界角 θ_c：

临界角公式 sin θ_c = n₂ / n₁ 当入射角 θ₁ ≥ θ_c 时，光全部被反射回纤芯——这就是全内反射 (Total Internal Reflection, TIR)。

关键结论：纤芯折射率必须大于包层（n₁ > n₂），否则不存在临界角，TIR 无法发生，光就会"逃逸"到包层中去。

图 2-2 Snell 定律与全内反射三种情形。当入射角超过临界角 θ_c，光被 100% 反射回纤芯。

为什么纤芯折射率必须大于包层？——数学推导

让我们做一个简洁的推导。全内反射要求：

光从纤芯（n₁）射向包层（n₂）的界面；
入射角 θ₁ 大于临界角 θc；
临界角由 sin θc = n₂ / n₁ 决定。

sin θc 必须是一个有意义的值（≤ 1），因此需要 n₂ / n₁ ≤ 1，即 n₁ ≥ n₂。如果 n₁ < n₂（纤芯折射率低于包层），sin θc 会大于 1，临界角不存在，全内反射永远不会发生——光全部泄漏到包层中。

结论：纤芯折射率必须大于包层折射率，才能形成全内反射，把光锁在纤芯中。这就是光纤能传导光的根本物理原因。

💡 数值示例

假设纤芯 n₁ = 1.48，包层 n₂ = 1.465：
sin θc = 1.465 / 1.48 = 0.9899 → θc ≈ 81.9°
只要光以大于 81.9° 的入射角（接近"擦着"界面的角度）进入纤芯-包层界面，就会被全反射回来。在光纤中，这个条件很容易满足。

数值孔径 (Numerical Aperture, NA)

NA 描述光纤能够接受的最大入射光锥角，是衡量光纤"集光能力"的关键参数：

数值孔径 NA = sin θ_a = √(n₁² − n₂²) θ_a 为光纤端面的最大受光角 (acceptance angle)。SMF 的 NA ≈ 0.12–0.14；MMF 的 NA ≈ 0.20–0.275。

💡 生活类比 — 漏斗
NA 就像漏斗口的大小：漏斗口越大（NA 越高），能接收的水（光）越多，但对水流方向的约束就越弱——这正是多模光纤 NA 较大但模间色散也更严重的根本原因。

▼ 模式：几何光学之上的波动故事 ▼

§2.3 多模 vs 单模光纤

🤔 思考
在几何光学中，满足全内反射条件的光线可以有很多不同的入射角——每一条不同角度的"锯齿"路径长度不同。如果很多条路径同时携带信号，到达终点的时间就有先有后。怎样把"多条路径"减少为"一条路径"？答案取决于一个参数——V 参数。

模式 (Mode) 的概念

从波动光学角度看，光在光纤纤芯中传播时，只有满足横向驻波条件的特定场分布才能稳定存在——这些稳定的场分布被称为模式 (Mode)。每个模式对应不同的传播常数 β，沿光纤传播的速度也不同。

多模光纤 (MMF)：纤芯较粗（≥ 50 µm），可支持成百上千个模式。不同模式到达时间不同 → 模间色散 (Intermodal Dispersion)。
单模光纤 (SMF)：纤芯极细（~ 9 µm），仅允许基模 LP₀₁ 传播。消除了模间色散 → 可支持长距离、高速率传输。

V 参数（归一化频率）

V 参数 (V-number) V = (2πa / λ) × NA a = 纤芯半径，λ = 工作波长，NA = 数值孔径。
当 V < 2.405 时，光纤只允许基模传播——即为单模条件。

直觉上理解 V 参数：纤芯越粗（a↑）、折射率差越大（NA↑）、波长越短（λ↓），V 越大，能支持的模式越多。反之，缩小纤芯、降低 NA、使用长波长，才能实现单模。

图 2-3 阶跃多模、渐变多模与单模光纤的折射率分布和光线传播对比。

多模光纤分类 (OM 等级)

等级	芯径 (µm)	折射率类型	带宽·距离	典型应用
OM1	62.5	渐变	200 MHz·km @850nm	百兆以太网 ≤300 m
OM2	50	渐变	500 MHz·km @850nm	1GbE ≤550 m
OM3	50	渐变（优化）	2000 MHz·km @850nm	10GbE ≤300 m
OM4	50	渐变（优化）	4700 MHz·km @850nm	40/100GbE ≤150 m
OM5	50	渐变（宽带优化）	支持 SWDM 850–953nm	短波波分复用

单模光纤标准

ITU-T 标准	名称	关键特性	典型应用
G.652	标准 SMF	零色散 @1310nm；全球部署量最大	城域/长途
G.654	截止波长位移 SMF	大有效面积，低衰减 @1550nm	海缆、超长距
G.655	非零色散位移 SMF (NZ-DSF)	C 波段色散 ≠ 0，抑制 FWM	DWDM 长途
G.657	弯曲不敏感 SMF	小弯曲半径 (≤7.5mm) 低损耗	FTTH 入户

多模光纤 vs 单模光纤——全方位对比

特性	多模光纤 (MMF)	单模光纤 (SMF)
纤芯直径	50µm 或 62.5µm	8–10µm
包层直径	125µm	125µm
传导模式数	数百到数千个	仅 1 个（基模 LP₀₁）
典型波长	850nm、1310nm	1310nm、1550nm
光源	LED 或 VCSEL	分布反馈激光器（DFB Laser）
典型传输距离	数百米至 ~2km	数十公里至数千公里
带宽能力	受模式色散限制，较低	极高（无模式色散）
典型应用场景	数据中心内部、楼内互联	城域网、长途骨干、DWDM 系统
成本	光纤和连接器便宜，光源便宜	光纤便宜，但精密激光器和对准成本较高
护套颜色（惯例）	橙色或浅蓝色（Aqua）	黄色（UPC）或绿色（APC）

💡 生活类比 — 走廊 vs 独木桥
多模光纤像一条宽走廊——很多人可以并排走，但速度不同的人到终点时间不一样（模间色散）。单模光纤像一座独木桥——只允许一人通行，虽然"入口"更小，但所有信息以完全相同的速度到达，适合远距离赛跑。

▼ 光走远了，信号变弱了——衰减 ▼

§2.4 衰减——信号的能量代价

🤔 思考
即使全内反射完美无缺，光在玻璃中传播数十公里后还是会变弱。能量去了哪里？又为什么偏偏在 1550 nm 附近损耗最低？

衰减的三大来源

吸收损耗 (Absorption)
- 紫外吸收：SiO₂ 电子跃迁，波长越短越严重。
- 红外吸收：Si-O 键振动吸收，波长 > 1600 nm 后急剧上升。
- OH⁻ 吸收峰：水分子残余在 ~1383 nm 形成吸收峰（现代"低水峰"光纤已基本消除）。
瑞利散射 (Rayleigh Scattering)：SiO₂ 在冷却过程中"冻结"的微观密度涨落（亚波长尺度）会散射光能。散射强度与波长的四次方成反比：

瑞利散射 α_R ∝ 1 / λ⁴ 波长越短，散射越强。这就是为什么 850 nm 窗口衰减高于 1310 nm 和 1550 nm。

弯曲损耗 (Bending Loss)：宏弯（光缆走线弯折）和微弯（涂覆层不匀对纤芯的微压）都可使光从纤芯泄漏。G.657 光纤专为弯曲不敏感优化。

衰减的量化

衰减公式 P_out = P_in × 10^−αL/10 α 为衰减系数 (dB/km)；L 为光纤长度 (km)。
典型值：1550 nm ≈ 0.20 dB/km；1310 nm ≈ 0.35 dB/km；850 nm ≈ 2.5 dB/km。
换言之，在 1550 nm 窗口，100 km 光纤仅引入 20 dB 损耗。

图 2-4 SiO₂ 光纤的衰减谱。C-Band (1550 nm) 衰减最低约 0.20 dB/km，是 DWDM 长距传输的最佳窗口。

为什么 1550 nm 最优？ 这是紫外侧瑞利散射（短波长强）与红外侧分子振动吸收（长波长强）两条衰减曲线的"谷底"——大自然为光通信留下的黄金窗口。

▼ 光走远了，脉冲变宽了——色散 ▼

§2.5 色散——脉冲展宽的元凶

🤔 思考
衰减只是让信号变弱，加个放大器就能补回来。但还有另一种损伤——色散 (Dispersion)：它让原本窄窄的脉冲逐渐展宽，最终相邻脉冲重叠、无法分辨。色散来自何处？有哪些类型？如何量化和对付它？

色散的物理图像

一个光脉冲并非单一频率，而是由一组频率（或波长）分量叠加而成。如果不同频率分量在光纤中传播速度不同，脉冲到达接收端时各分量就会"散开"——表现为脉冲展宽。当展宽大到相邻比特重叠，就产生了码间干扰 (Inter-Symbol Interference, ISI)，直接限制传输速率和距离。

色散的三种类型

① 材料色散
(Material Dispersion)

玻璃的折射率随波长变化（即 n = n(λ)），所以不同波长的光在玻璃中速度不同。激光器发出的光并非完美的单一波长，而是有一定谱宽——这些略有差异的波长成分以不同速度传播，导致脉冲展宽。

类比：一群跑步者速度不同，出发时挤在一起，跑远了就拉开了差距。

② 波导色散
(Waveguide Dispersion)

光在纤芯中并非 100% 被束缚——约有 20% 的光能量延伸到包层中。不同波长的光，其能量在纤芯与包层中的分布比例不同，因此有效折射率不同、传播速度不同。波导色散通常与材料色散符号相反，两者叠加后形成色度色散（Chromatic Dispersion, CD）。

③ 偏振模色散
(PMD)

理想光纤是完美圆形截面，但实际光纤总有微小的椭圆度和内应力，导致两个正交偏振模式（X 和 Y 方向）的传播速度略有差异。脉冲在两个偏振方向上的分量到达时间不同，造成展宽。PMD 是随机的、时变的，难以简单补偿。

单位：ps/√km；10G 系统容忍约 10ps，100G 以上需要相干 DSP 补偿。

色度色散 (CD) 详解

色度色散是单模系统中最重要的色散类型，由两部分叠加：

材料色散 (Material Dispersion)：SiO₂ 玻璃的折射率 n 本身就是波长的函数（n(λ)）。不同波长的光传播速度不同。
波导色散 (Waveguide Dispersion)：光在纤芯/包层界面的场分布随波长变化，有效折射率也随之变化。波导色散的符号通常与材料色散相反。

两者之和 D(λ) 的单位是 ps/(nm·km)——即每公里光纤中，每 nm 光谱宽度引起的脉冲展宽 (ps)。

色度色散引起的脉冲展宽 Δτ = |D| × Δλ × L D = 色散参数 [ps/(nm·km)]；Δλ = 光源谱宽 (nm)；L = 光纤长度 (km)。
例：D=17，Δλ=0.1nm（外调制 DFB），L=100km → Δτ = 170 ps。对 10G NRZ（bit period=100ps）已产生严重 ISI。

图 2-5 色散引起脉冲展宽：传输距离越长，脉冲越宽，最终相邻比特重叠产生 ISI。

偏振模色散 (PMD)

理想光纤是完美圆对称的，但实际制造中的微小椭圆度和外部应力会使两个正交偏振态（水平 / 垂直）的传播速度略有不同。PMD 的均值增长方式与 CD 不同——它与距离的平方根成正比，且具有随机统计特性，难以用固定补偿器消除。现代光纤的 PMD 系数已降至 ≤0.1 ps/√km，但在 400G+ 相干系统中仍需 DSP 动态补偿。

色散补偿策略（预告）

色散补偿光纤 (DCF)：D ≈ −100 ps/(nm·km) 的特殊光纤，串联在传输光纤后以抵消正色散。传统 10G DWDM 系统的标准做法。
光纤布拉格光栅 (FBG)：利用色散斜率可调的反射式光栅实现色散补偿。
相干 DSP（数字信号处理）：现代 100G+ 相干系统在接收端通过电域均衡完全补偿 CD 和 PMD——这是模块三将深入介绍的革命性方案。

💡 生活类比 — 马拉松赛跑
想象一场马拉松：一群速度各异的跑者（不同波长/偏振的光）同时起跑。跑短距离时大家还挤在一起；跑完 42 公里后，快的已经冲线、慢的才到一半——队伍被"色散"拉开了。
DCF 色散补偿就像在终点前设一段"倒跑赛道"，让跑得快的人折返一段，等慢的追上来再一起冲线。
相干 DSP则更高级——裁判（接收端）记住每个人的速度差，然后在计算中把所有人的到达时间"对齐"。

▼ 当光足够强——非线性效应 ▼

§2.6 非线性效应——光纤的"力量极限"

🤔 思考
衰减让信号变弱，色散让脉冲展宽——这两者都是线性效应，理论上可以被完全补偿。但当我们为了对抗衰减而把光功率提高时，光纤本身的折射率开始随光强变化——非线性效应登场了。它为系统容量设定了一个不可逾越的"天花板"。

Kerr 效应

光纤 SiO₂ 的折射率在高光功率下不再恒定，而是与光强 I 成正比：

Kerr 效应 n(I) = n₀ + n₂ · I n₂ ≈ 2.6 × 10⁻²⁰ m²/W（极小，但在长距离 × 小模场面积的光纤中效果积累显著）。

Kerr 效应衍生出三种主要非线性损伤：

非线性效应	物理机制	对系统的影响
自相位调制 (SPM)	信号自身强度调制引起折射率变化 → 自身频率啁啾	与 CD 交互加剧脉冲畸变
交叉相位调制 (XPM)	DWDM 中相邻信道强度变化导致本信道折射率波动	信道间串扰
四波混频 (FWM)	三个频率分量的参量混频产生新频率	当信道等间距 + 低色散时尤为严重（这也是 G.652 零色散点不在 C 波段反而是优势的原因——非零色散可抑制 FWM）

另一大类非线性：受激散射（Stimulated Scattering）

Kerr 效应来源于折射率的"光强依赖"——是一种"弹性"非线性（不改变光子能量）。而受激散射是一类"非弹性"非线性——光子与光纤中的声子（振动能量）或分子振动发生能量交换，产生频率不同的新光波。它们是现实系统中不可忽视的"硬物理限制"：

效应	英文全称	物理机制	对系统的影响
SBS	Stimulated Brillouin Scattering 受激布里渊散射	光子与光纤声子耦合，产生频率下移约 11 GHz 的后向散射光	对窄线宽、高功率的单频信号极敏感。阈值功率低至 +7~+10 dBm。超过阈值后，大量功率被反射回发射端，不仅浪费能量，还会损坏激光器。应对：给激光器加相位抖动（dithering）或使用较宽线宽，把功率谱"摊薄"到 SBS 阈值以下。
SRS	Stimulated Raman Scattering 受激拉曼散射	光子与 SiO₂ 分子振动耦合，能量从短波长信道转移到长波长信道，频移约 13 THz（~100 nm）	在 C+L 波段大宽带 DWDM 系统中，C 波段的短波长信道会"喂养"L 波段的长波长信道，导致功率倾斜（Power Tilt）——短波衰减、长波增强。应对：均衡器预倾斜、或利用 SRS 做拉曼放大器（把"敌人"变"朋友"）。

🔄 化敌为友：受激拉曼放大器
SRS 本是损伤，但聪明的工程师把它反过来用了：在光纤近端注入一束 1450 nm 的强"泵浦光"，通过 SRS 效应把能量持续传递给 1550 nm 的信号光——这就是分布式拉曼放大（DRA, Distributed Raman Amplification）。它的独特优势是"放大发生在整根光纤上"而非集中点，显著降低等效噪声系数，是超长距海缆系统的标配技术。

工程启示：非线性效应设定了"入纤功率上限"——功率不能无限提高。这与衰减（需要高功率）和 Shannon 定理（SNR 越高容量越大）形成了根本矛盾，最终定义了光纤系统的非线性 Shannon 极限——我们将在后续高级模块中深入探讨。

⚠️ 终极碰撞：当香农极限遇上光纤非线性

经典的香农公式告诉我们：不断提高发射功率（提升 SNR），容量就能无限增长。但这在光纤中被打破了！当光功率超过最佳阈值（通常在几毫瓦量级），Kerr 非线性效应会引发严重的串扰和畸变。这导致实际信道容量在达到峰值后，随着功率增加反而暴跌——这就是光通信领域最著名的“非线性香农极限（Nonlinear Shannon Limit）”。

▼ 模块二 · 核心回顾 ▼

§2.7 模块回顾

🔑 8 个核心要点

三层结构：光纤由纤芯（高折射率）/ 包层（低折射率）/ 涂覆层组成，折射率差是一切的基础。
全内反射 (TIR)：当入射角 ≥ 临界角 θ_c = arcsin(n₂/n₁) 时光被 100% 反射回纤芯——这是光纤导光的物理基石。
数值孔径：NA = √(n₁² − n₂²)，衡量光纤的集光能力。
V 参数 < 2.405：单模条件。纤芯越细、NA 越小、波长越长 → 模式越少。
单模 vs 多模：SMF 消除模间色散，适合长距高速；MMF 芯径粗、耦合容易，适合数据中心短距。
衰减：瑞利散射 (∝1/λ⁴) + 吸收 + 弯曲损耗。1550 nm 是衰减最低点 (~0.20 dB/km)。
色散：CD 使脉冲展宽、产生 ISI；PMD 具有随机性。色散可通过 DCF 或相干 DSP 补偿。
非线性效应：Kerr 效应 (SPM/XPM/FWM) 设定了入纤功率上限，与衰减形成根本矛盾，最终决定系统容量极限。

🤔 通往模块三的桥梁
我们已经拥有了优秀的载体（光）和高速公路（光纤）。但光本身只是一束电磁波——如何在光波上"写入"和"读出"数字信息？

最简单的方法是 "亮=1，灭=0"（OOK），但这效率太低。如果我们不只控制亮灭，还控制振幅的大小 (PAM4)、光波的相位 (PSK)、甚至振幅+相位同时调制 (QAM)呢？

模块三：调制与解调——信息的编码之术，将从最简单的开关键控走向最前沿的相干正交调制，揭示光通信系统如何在同一根光纤中塞入越来越多的比特。

Module 03 of 03

调制与解调

光是载体，光纤是通道，但信息到底是怎样"坐上"光波的？从最简单的"开灯/关灯"到一秒钟传输 800 Gb 的 DP-16QAM——这是一场关于信号、数学与工程智慧的精彩旅程。

假设你要把一张高清照片从北京发到纽约——大约 10 MB 的数据。如果按照模块一里 OOK 的方式（有光=1、无光=0），在一根传输速率 10 Gb/s 的光纤上只需 8 毫秒。那么问题来了：我们真的把光的"潜力"用尽了吗？光波除了"亮"和"灭"，还有没有别的"维度"可以用？

提示：回忆一下模块一中提到的光波的四个可调制维度。

3.1 调制的本质——让光波"背上"信息

What — 什么是调制？

调制 (Modulation) 是把"信息信号"（基带信号，Baseband）加载到"载波信号"（Carrier）上的过程。在光通信中，载波就是一束频率约 200 THz 的光波，调制的任务就是通过改变光波的某一个（或几个）物理属性来编码 0 和 1。

类比：广播电台

FM 广播（调频）通过改变无线电波的频率传递声音，AM 广播（调幅）通过改变振幅传递声音——载波都是几百兆赫兹的无线电波，信息都是几千赫兹的音频信号。光通信本质上也是"广播"，只是载波频率从 100 MHz 跃升到 200 THz——翻了 100 万倍，能塞进去的"节目"自然也多了 100 万倍。

Why — 为什么必须调制？

这个问题有三层答案，一层比一层深：

基带信号无法直接传输：我们想传的是数字比特流（0/1 脉冲），它的频谱从 0 Hz 开始——这样的信号无法在光纤这样的高频介质上有效传播。必须"搬移"到光频段。
频分复用的基础：不同信息可以被调制到不同频率的载波上，同时在同一根光纤中并行传输而互不干扰——这就是 DWDM（密集波分复用）的核心思想，模块五、六将详述。
逼近香农极限：回顾 C = B·log₂(1+SNR)。同样的带宽 B、同样的 SNR 下，聪明的调制方式能让频谱效率（bits/s/Hz）翻倍甚至翻八倍。这是光通信从 10G → 100G → 400G → 800G → 1.6T 进化的核心动力。

一束"空白"光波本身不携带信息，通过有规律地改变振幅 A、频率 f 或相位 φ，就能把 0 和 1 "写"到光上。

How — 光波的四个可调制维度

一个单色光波的完整描述包含四个物理量：

核心公式 ⑦：光波的完整表达

E(t) = A · cos(2π·f·t + φ) · ê

A（振幅 Amplitude） · f（频率 Frequency） · φ（相位 Phase） · ê（偏振方向 Polarization）

这四个量中的任何一个被改变了，都意味着"调制"在发生：

🔆

振幅 A

最直观——光亮=1、光暗=0，这就是 OOK。若用多个亮度等级就是 PAM。

🌈

频率 f

用不同"颜色"的光代表不同比特。FSK 曾用于早期光通信，现代已少用单独 FSK，但 DWDM 本质是频率多路复用。

🔄

相位 φ

光波的"起跑时刻"不同——肉眼完全看不出，但仪器能精确分辨。PSK 系列的核心武器。

✖️

偏振 ê

光波电场振动的方向（水平/垂直）。两个正交方向可承载两路独立信号——容量直接翻倍！

图 3-1：光波的四个可调制维度。现代高阶相干调制技术同时利用振幅、相位、偏振三个维度（频率用于 DWDM）。

💡 物理实现机制：马赫-曾德尔调制器 (MZM)

你可能会好奇：光速那么快，频率那么高，工程师到底是如何在物理上瞬间改变光的"振幅"和"相位"的？光通信工业界使用了一种极其精妙的结构——马赫-曾德尔干涉仪 (Mach-Zehnder Modulator, MZM)。

分流与汇合的艺术：想象把一条水流（连续的激光）平均分成两条支流。如果在其中一条支流的管道上施加电压，利用特殊材料的电光效应改变它的折射率，这条支流里的光速就会微调，从而产生"相位延迟"。当两条支流再次汇合时：

• 建设性干涉：如果两束光汇合时波峰对波峰（相位一致），就会叠加变亮（输出 1）。
• 破坏性干涉：如果波峰对波谷（相差 180°/π），就会互相抵消变暗（输出 0）。
通过巧妙控制电压，我们就能用电信号精准把控光的明暗与相位跳转。现代的硅光模块，本质上就是在微米级的芯片上刻蚀了无数个这样微小的"分流汇合"干涉仪！

🔍 核心概念辨析：波特率 (Baud Rate) vs 比特率 (Bit Rate)

在进入调制之前，必须厘清这两个极易混淆的概念，这是理解所有光模块参数的钥匙：

波特率 / 符号率 (Baud Rate)：物理层面的“动作频率”，指一秒钟内光波状态（符号）改变的次数。它直接决定了系统所需的物理带宽（奈奎斯特定理）。
比特率 / 数据率 (Bit Rate)：信息层面的“传输速度”，指一秒钟内实际传输了多少个 0/1。

公式：比特率 = 波特率 × 每个符号携带的比特数

💡 物流车队类比：波特率就像是车队在高速公路上往返的“车次/小时”；比特率是总共运送的“货物吨数/小时”。高阶调制（如 16QAM）的作用就是把每辆小货车（1 吨）换成重型卡车（4 吨），从而在不增加车次（不占用更多公路带宽）的情况下，成倍提升总运力。

3.2 OOK——最简单的调制方式

What — OOK 是什么？

OOK（On-Off Keying，开关键控） 是最简单、历史最悠久的光调制方式：有光代表 1，无光代表 0。本质上就是"激光器开/关"的数字化控制。

How — OOK 的两种波形：NRZ vs RZ

即使同样是 OOK，比特如何"占据时间槽"也有讲究：

NRZ（Non-Return-to-Zero）：如果连续两个比特都是 1，光一直亮不归零——波形平直。
RZ（Return-to-Zero）：每个 1 的中间必须回到 0，波形是一串明显分离的脉冲。

图 3-2：同一个比特序列的 NRZ 与 RZ 波形对比。NRZ 频谱占用小；RZ 时序清晰但带宽需求更大。

Why — OOK 的致命弱点

OOK 的核心问题在于接收端采用 直接检测（Direct Detection, DD）：光电二极管输出的电流正比于入射光强度的模平方 |E|²——所有关于相位的信息完全丢失了。

类比：只能分辨"亮"和"暗"的摄像机

想象一台黑白低分辨率摄像机：它只能告诉你画面的明暗变化，但完全看不到颜色（频率）、也分辨不出纹理细节（相位）。OOK + DD 就是这样一套系统——你只用了光的一个维度，忽略了其他三个。这就像用一辆十车道高速公路只跑一辆车。

OOK 的频谱效率是 1 bit/symbol——每个符号（时间片）只承载 1 比特。想要再把速率翻倍，只能靠提高波特率（符号率）。但波特率受限于器件带宽和色散——这就是为什么 10G NRZ 可以长距离传输，但 40G NRZ 就举步维艰、25G NRZ 只能走几公里的根本原因。

🚧 深度解析：为什么不能无限提高波特率？

波特率（即每秒发送符号的次数）的提升并非没有代价，它主要受限于硬件电路的响应极限与光纤物理特性的平方级惩罚：

1. 器件与频谱带宽瓶颈（硬件限制）：
• 高频电子器件极限：提高波特率意味着光网络的核心组件（包括激光器、调制器、DAC 和 DSP）必须在极高的频率下进行切换。受限于材料物理特性和高频微波电路的瓶颈，器件的响应带宽存在硬性上限。
• 信道频谱挤占：波特率的增加会成比例地扩大信号所需的物理频谱宽度。例如，将波特率从 32 Gbaud 提升到 64 Gbaud，信号所需的信道大小会从 37.5 GHz 扩大到 75 GHz。传统固定频带（Fixed Grid）的 DWDM ROADM 系统往往受限于固定的“车道”宽度，无法容纳如此宽的信号。
2. 色散限制（物理法则的残酷惩罚）：
• 线宽变宽：波特率越高，意味着每一个光脉冲在时间上越短，这导致信号的光谱线宽（Linewidth）变得更宽。
• 平方级惩罚：最致命的物理法则是——光纤色散对信号的影响与波特率的平方成正比。这意味着波特率翻倍，色散的破坏力会急剧增加 4 倍。
• 码间干扰 (ISI) 爆发：由于这种平方级的色散放大效应，高波特率的光脉冲在极短的传输距离内就会被拉宽、抹平，导致前后脉冲严重重叠，接收端将完全无法分辨独立的信号。

3.3 高阶调制——从 PAM4 到 DP-16QAM

3.3.1 PAM4——让光的亮度有 4 个台阶

What

PAM4（4-Level Pulse Amplitude Modulation，4 电平脉冲振幅调制） 是 OOK 的直接升级：把光强分成 4 个等级（00、01、10、11），每个符号承载 2 bits。

更小→
抗噪差

图 3-3：PAM4 波形与星座图示意。4 个电平相邻间距只有 OOK 的 1/3，对 SNR 要求更高。

Why

PAM4 是数据中心短距互联（400G DR4/FR4、800G DR8/FR8）的主流调制格式。原因是：

仍然可以用直接检测（只看强度即可），接收机简单便宜；
在同样 50 Gbaud 波特率下，PAM4 达到 100 Gb/s（NRZ 只有 50 Gb/s）；
相比于 QAM 这种高阶调制，硬件成本低几个数量级——非常适合数据中心内部几百米到几公里的距离。

代价是：4 个电平相邻间距只有 OOK 两个电平的 1/3，所以对 SNR 的要求提高约 9.5 dB，对色散和非线性更敏感，传输距离受限。

3.3.2 PSK——在"相位"上做文章

振幅调制看得见，相位调制看不见——但它是现代高阶调制的基石。

BPSK（Binary PSK，二进制相位键控）

只用两个相位：0 和 π。

比特 0 → 相位 0（波形"正常"）
比特 1 → 相位 π（波形"翻转"180°）

振幅保持不变，所以看起来光强是恒定的——但相位在 0 和 π 之间跳变。

QPSK（Quadrature PSK，四相位键控）

使用 4 个相位：π/4、3π/4、5π/4、7π/4（等价于 45°、135°、225°、315°）。每个符号携带 2 bits。

图 3-4：BPSK 与 QPSK 的星座图。QPSK 在不增加波特率的情况下容量翻倍，是相干光通信的基础。

3.3.3 QAM——同时控制"亮度"和"相位"

What — I/Q 分解

任何一个单频正弦信号都可以分解为两个正交分量：

核心公式 ⑧：I/Q 分解

s(t) = I · cos(2π·f·t) − Q · sin(2π·f·t)

I（In-phase，同相分量）和 Q（Quadrature，正交分量）——通过这两个数值的组合，可以任意构造信号的振幅和相位。
振幅 = √(I² + Q²)；相位 = arctan(Q/I)

也就是说，I 和 Q 是信号的"笛卡尔坐标"——在 I/Q 平面上画一个点，就对应一个特定振幅+相位的光波。这就是星座图的数学本质。

类比：GPS 坐标 vs 极坐标

描述北京鸟巢的位置，你可以说"距离天安门 8 公里，方向东北偏东 30°"（极坐标：振幅+相位），也可以说"东经 116.39°、北纬 39.99°"（笛卡尔坐标：I/Q）。两种描述方式数学上完全等价，但在工程实现上，笛卡尔坐标（I/Q）要容易得多——这就是为什么所有的现代相干光调制器都使用 I/Q 结构。

16QAM 星座图

16QAM 在 I/Q 平面上摆出一个 4×4 的方阵——共 16 个点，每个符号承载 4 bits。

图 3-5：16QAM 星座图。16 个符号点分布在 3 种振幅 × 12 种相位上（用格雷码映射最小化误码影响）。

16QAM 的关键观察：

每符号 4 bits，频谱效率是 QPSK 的 2 倍；
需要更高的 SNR 才能正确解调（相邻点距离更小）；
使用格雷码（Gray Code）映射：相邻点只差 1 bit，降低误码影响。

同理，64QAM（8×8 方阵，6 bits/symbol）、256QAM（16×16 方阵，8 bits/symbol）是更高阶版本，频谱效率继续提升，但 SNR 要求也越来越苛刻。

3.3.4 偏振复用——让容量再翻倍

光波有两个正交的偏振方向（X 和 Y），它们在光纤中几乎独立传输——这意味着我们可以在这两个偏振上各发送一路独立的 QPSK/16QAM 信号，容量直接翻倍，但不消耗额外带宽！

于是产生了一系列"DP-"（Dual-Polarization）调制格式：

调制格式	每符号比特数	频谱效率	64 Gbaud 总速率	典型应用距离
NRZ (OOK)	1 bit	1 bit/s/Hz	—	10G 短距
PAM4	2 bits	2 bit/s/Hz	—	100–800G 数据中心 <10 km
DP-QPSK	4 bits (2×2)	4 bit/s/Hz	256 Gb/s	100G/200G 长途 >1000 km
DP-16QAM	8 bits (4×2)	8 bit/s/Hz	512 Gb/s	400G 城域/区域 ~600 km
DP-64QAM	12 bits (6×2)	12 bit/s/Hz	768 Gb/s	800G 短距 <300 km
DP-256QAM	16 bits (8×2)	16 bit/s/Hz	1024 Gb/s	1.6T 超短距 <100 km（前沿）

综合计算示例

以一个典型的 400G 相干系统为例：

调制格式：DP-16QAM
波特率：64 Gbaud
每符号比特数：4 (16QAM) × 2 (双偏振) = 8 bits/symbol
原始速率：64 × 8 = 512 Gb/s
扣除 FEC 开销（~20%）和头开销：净荷 ≈ 400 Gb/s ✅

这就是现代 100G/400G/800G 相干光模块背后的"数学魔法"。信息论的每一个维度都被充分榨取了：

🧮 DP-16QAM 的符号空间精确计算

X 偏振

16 个星座点

log₂(16) = 4 bits

Y 偏振

16 个星座点

log₂(16) = 4 bits

总组合

16 × 16 = 256

每符号 8 bits

关键洞察：X 和 Y 两个偏振是独立并行的通道（而非相乘后再选择），所以它们的比特数是相加（4 + 4 = 8），但两者组合的符号空间是 16 × 16 = 256——两种说法数学等价。

3.4 调制背后的数学原理

我们已经看到调制格式如何把比特"塞进"光波。但一个更深刻的问题是：这些星座图、波特率、带宽之间有没有隐藏的数学规律？为什么 16QAM 比 QPSK 快一倍，却需要更高的 SNR？为什么带宽和速率之间有一个绝对不可突破的理论上限？

提示：答案藏在三个伟大的名字里——傅里叶、奈奎斯特、香农。

3.4.1 傅里叶变换——时域与频域的桥梁

傅里叶变换（Fourier Transform）告诉我们一个惊人的事实：任何时域信号都可以被分解为无穷多个不同频率正弦波的叠加。

核心公式 ⑨：傅里叶变换

S(f) = ∫ s(t) · e^−j2πft dt

s(t) 是时域信号，S(f) 是它的频谱。反变换则把频谱"组合"回时域信号。
一个信号在时域看似复杂，在频域可能异常简洁，反之亦然。

类比：钢琴和弦的分解

你听到一段和弦（时域信号），钢琴调音师能告诉你它由 Do + Mi + Sol 三个音组成（频域分量）。时域是"你听到了什么"，频域是"有哪些音符"。傅里叶变换就是那个"调音师的耳朵"——它把复杂波形拆解成一个个单色正弦波。

在光通信中，傅里叶变换的意义至关重要：

分析信号带宽：一个数字脉冲在时域看是方方正正的，但在频域展开后占据了很宽的频率范围。调制格式决定了信号的频谱形状和带宽。
理解色散：色散本质上是不同频率成分以不同速度传播——这在频域中更容易理解和补偿。
DSP 处理：相干接收机中的数字信号处理（DSP）芯片，大量使用快速傅里叶变换（FFT）来进行均衡、色散补偿和载波恢复。

一个"看似简单"的方波，在频域中展开为无穷多个频率成分——这就是傅里叶变换揭示的真相

3.4.2 奈奎斯特定理——带宽的绝对下限

1928 年，奈奎斯特（Harry Nyquist）证明了一个优雅而深刻的定理：

核心公式 ⑩：奈奎斯特带宽

B_min = R_s / 2

R_s = 符号率（Symbol Rate，单位 Baud），B_min = 无 ISI 传输所需最小带宽。
等价地：在带宽 B 的信道中，可传输的最大符号率为 2B Baud。

这个定理告诉我们：要传输 64 Gbaud 的符号流，至少需要 32 GHz 的信道带宽。这是物理定律，不可商量。

奈奎斯特脉冲成形（Nyquist Pulse Shaping）

理论上，一个理想的 sinc 脉冲——时域零点精确落在其他符号中心的脉冲——可以在最小带宽下实现无 ISI 传输。但 sinc 脉冲在时域是无限延展的，实际工程中采用升余弦（Raised Cosine）脉冲近似：

滚降因子 α（Roll-off factor）：控制频谱从平坦区过渡到零的陡峭程度。α 越小，频谱越接近理想 sinc，但时域振荡越长，对定时误差敏感；α 越大（如 0.2、0.5），实际带宽占用 =（1+α）·R_s/2，但对时序更宽容。
现代相干系统普遍采用 α = 0.05–0.2 之间的升余弦成形，配合数字信号处理（DSP）在发射端精确成形每个符号波形。

图 3-6：奈奎斯特理想频谱（蓝）与升余弦频谱（橙）。时域中脉冲在相邻符号中心为零，保证无码间干扰。

3.4.3 香农极限——容量的理论天花板（再探）

回到模块一的香农公式 C = B · log₂(1+SNR)，现在我们能从调制角度重新诠释它：

核心公式 ⑪：频谱效率

SE = C / B = log₂(1 + SNR) (bit/s/Hz)

SE = 频谱效率（Spectral Efficiency），衡量每单位带宽能承载多少 bit/s。
SNR 单位为线性值（非 dB）。例：SNR=15（≈11.8dB）→ SE = log₂(16) = 4 bit/s/Hz，恰好对应 16QAM 的理想极限。

这个公式背后隐藏着一个"残酷"的对数关系：

SNR 每翻倍（+3 dB）→ 频谱效率只增加 1 bit/s/Hz；
SNR 每增 10 倍（+10 dB）→ 频谱效率只增加约 3.3 bit/s/Hz；
从 QPSK（4 bit/s/Hz，含双偏振）升级到 16QAM（8 bit/s/Hz）需要 SNR 提升约 6–7 dB。

3.4.4 星座图与欧氏距离——调制的"命门"

在星座图上，任意两个星座点之间的距离叫做欧氏距离（Euclidean Distance）。在所有距离中，最短的那个叫最小欧氏距离 d_min——它直接决定了系统的抗噪声能力：

核心公式 ⑫：误码率与 d_min 的关系

BER ∝ Q( d_min / (2σ) )

Q(·) 是高斯 Q 函数；σ 是接收噪声的标准差。
d_min 越大，接收机越容易区分不同符号，误码率越低。

这揭示了高阶调制的根本代价：在相同的平均发射功率下，星座点越密集，d_min 越小。定量地：

调制格式	星座点数	每符号比特	归一化 d_min	理论 SNR 阈值 (BER=10⁻⁹)
BPSK	2	1	2.00	~9.6 dB
QPSK	4	2	1.41	~12.6 dB
16QAM	16	4	0.63	~20.0 dB
64QAM	64	6	0.31	~26.5 dB
256QAM	256	8	0.15	~33.0 dB

3.4.5 PCS——让星座点"有轻有重"的现代魔法

传统 QAM 中所有星座点被等概率发送——这在数学上并非最优。1975 年以来的理论告诉我们：在功率受限信道中，外围点（高能量）应该少发，内部点（低能量）应该多发，才能逼近 Shannon 极限。这就是 PCS（Probabilistic Constellation Shaping，概率星座整形） 的核心思想。

🧬 PCS 在做什么？
以 64QAM 为例：四角的 4 个外部点能量最高（功率大但对 SNR 贡献小），中心的 4 个内部点能量最低。PCS 让内部点发送概率远高于外部点（类似高斯分布），整体平均功率不变，但有效 SNR 提升 1–1.5 dB，等价于距离延伸 30–50%。

更妙的是——通过连续调节外围点的抑制比例，PCS 可以实现 1 bit 精细粒度的速率调整（如 400G、450G、500G、550G…800G），而无需换硬件。这就是今天 Cisco NCS 1010 等现代 DCO 相干模块能在同一片 DSP ASIC 上支持 100G–1200G 全区间的关键。

图 3-8：均匀分布与概率整形（PCS）星座图对比。PCS 通过调整符号发送概率，逼近高斯分布，接近 Shannon 极限。

这就是"距离 vs 容量"永恒权衡的数学根源：想要更高的频谱效率（更多 bit/s/Hz），就必须付出 SNR 的代价；SNR 不够时，只能退回低阶调制、但距离可以更长。所有现代相干光收发机都支持"灵活速率调制（Flexible Rate）"——根据链路实际信噪比，动态选择最优调制格式，把每一分 SNR 都榨干。

类比：高清电视的"码率自适应"

Netflix 和 YouTube 会根据你的网络质量自动调整视频码率：网速好时推 4K、网速差时降到 720p——这和光通信的"灵活速率"思路一模一样。链路 OSNR 高时跑 DP-64QAM（800G），OSNR 下降时自动切到 DP-16QAM（400G）甚至 DP-QPSK（200G），保持链路稳定传输不中断。

3.5 解调——如何把光变回电比特

3.5.1 直接检测（Direct Detection, DD）

最简单的解调方式：一个光电二极管（Photodiode, PD）将入射光子转化为电流，电流幅度正比于入射光强 |E|²。

核心公式 ⑬：直接检测输出

I_PD(t) ∝ |E(t)|² = A²(t)

光电二极管只输出振幅的平方——完全丢失相位 φ 和偏振 ê 信息！

所以 DD 只能解调强度调制信号：OOK、PAM4、以及少数特殊形式（如 DMT）。它解调不了 BPSK、QPSK、QAM 这些相位载信信号——这就是为什么 100G 以上的长距传输必须采用相干检测。

3.5.2 相干检测（Coherent Detection）

相干检测是现代高速光通信的核心技术。核心思路是：在接收端引入一束参考光（本地振荡激光，Local Oscillator, LO），让信号光与 LO 光"拍频"干涉，从而把信号的振幅和相位信息"搬移"到电信号上。

图 3-7：相干接收机的完整架构。PBS 分离偏振，90° Hybrid 与 LO 混频获取 I/Q 分量，ADC 采样后由 DSP 完成全部均衡、补偿和判决。

相干检测的工作流程：

偏振分离（PBS）：将接收光分离为 X、Y 两路偏振；
90° 光混合器（Hybrid）：让信号光与 LO 光在 4 个相位差（0°, 90°, 180°, 270°）下干涉；
平衡光电探测：输出 4 路基带电信号（X-I, X-Q, Y-I, Y-Q）；
ADC 数字化采样：典型采样率为 2× 符号率；
数字信号处理（DSP）：这是魔法发生的地方——

💡 相干 DSP 能够在电域内完成这些事情：

色度色散补偿：数千 ps/nm 的 CD 可被完全数字补偿，彻底取代了传统的 DCF 色散补偿光纤！
PMD 动态均衡：跟踪光纤偏振态的时变漂移；
偏振解复用：把 X/Y 两路信号正确地分开；
载波相位恢复：扣除激光器相位噪声；
非线性补偿：先进 DSP 甚至可以部分抵消光纤非线性损伤；
FEC 译码：结合 SD-FEC 软判决纠错，把工作 SNR 向香农极限逼近 1 dB 以内。

💡 魔法解密：DSP 与主动降噪耳机 (ANC)

相干 DSP 是如何在电域里"抵消"掉光纤数千公里积累的物理色散的？听起来像魔法，但其核心逻辑与我们常用的主动降噪耳机 (Active Noise Cancellation) 非常相似。

降噪耳机听取外界环境噪音，然后经过芯片计算，播放一段与噪音波形完全相反（相位差 180°）的声波，两者在你的耳朵里互相抵消，世界就安静了。相干 DSP 做的事情如出一辙：光信号在光纤中因为色散（CD）变得面目全非，但色散的物理演化过程是确定且可被数学精确描述的。DSP 只需要在数字域里构建一个与光纤色散特性完全相反的"反向数学滤波器"，让受损的数字信号穿过这个滤波器，所有的变形就会被奇迹般地"反向抵消"，完美还原出原本锐利的脉冲！

现实中的相干光模块：一张能运行 DSP 的"小板子"

今天，相干检测不再是昂贵的机柜级设备——它已经被封装成可热插拔的 QSFP-DD / OSFP 光模块，大小和一颗巧克力差不多：

400G ZR

短距 DCI

📏 距离：≤120 km

🎛️ 调制：DP-16QAM

🔋 功耗：≤15 W

📐 封装：QSFP-DD

OIF 标准，用于数据中心之间的点到点互联，取代传统 10×40G/4×100G 灰光。

400G ZR+

城域网

📏 距离：≤1000 km

🎛️ 调制：DP-16QAM+PCS

🔋 功耗：≤21 W

📐 封装：QSFP-DD / CFP2

OpenZR+ MSA，支持可调谐波长、FEC 增强，可直接插到路由器端口实现 IP+Optical 融合。

800G ZR/ZR+

下一代主力

📏 距离：≤120 / ≤1500 km

🎛️ 调制：DP-16/64QAM+PCS

🔋 功耗：≤25 W

📐 封装：QSFP-DD800 / OSFP

基于 130+ Gbaud DSP ASIC（如 Cisco 7nm），2024–2026 年规模商用，AI 数据中心互联主流。

1.6T（研发）

前沿

📏 距离：≤80 km (短距)

🎛️ 调制：DP-64/256QAM+PCS

🔋 功耗：~30+ W

📐 封装：OSFP-XD

采用 ~200 Gbaud 波特率，需要 3 nm DSP 工艺，预计 2026+ 进入样品与小规模部署。

一个惊人对比：从机柜到模块

2010 年的第一代 100G 长途相干系统是整个机柜，功耗 >400 W、成本百万美元级；今天的 400G ZR+ 模块只有一支笔那么大，功耗 20 W 左右、成本降到千美元级。短短 14 年，单位比特的功耗和成本下降了三个数量级——这就是 CMOS 工艺 × DSP 算法 × 硅光子集成共同创造的奇迹。

正是这套"光域采集 + 数字域处理"的架构，让 100G/400G/800G 相干光系统成为可能。可以毫不夸张地说：现代光通信的 99% 智慧都在 DSP 里。

3.5.3 前向纠错（FEC）——最后的信号守护神

即使调制、解调、DSP 都已经做到最优，信道中的随机噪声仍会造成误码。前向纠错（Forward Error Correction, FEC）在发送端为数据加入冗余校验位，让接收端能够检测并纠正一定数量的错误——无需重传。

FEC 类型	开销	典型算法	编码增益	应用
HD-FEC（硬判决）	~7%	RS(255,239), BCH	5–6 dB	传统 10G/40G 长距
SD-FEC（软判决）	15–25%	LDPC, Turbo, oFEC	9–11 dB	现代 100G+ 相干
cFEC / oFEC	~15%	级联软判决	10–11.5 dB	400G/800G ZR/ZR+

核心公式 ⑭：净荷速率 = 原始速率 × (1 − FEC 开销)

R_net = R_line × (1 − OH_FEC − OH_框架)

例：64 Gbaud DP-16QAM，R_line = 512 Gb/s，总开销 ~20% → R_net ≈ 400 Gb/s。

类比：信件的"重要单词重写三遍"

如果你寄一封手写信件，担心某些字会被水弄糊，你可能会把关键单词重写三遍——即使两遍被糊掉，第三遍能让收件人恢复原意。FEC 就是这种"冗余备份"的数学版本——它不是简单重复，而是通过精妙的代数结构，让少量冗余就能纠正更多错误。SD-FEC 让现代光系统以比经典香农公式预测更低的 SNR 工作，逼近 Shannon 理论极限。

⚠️ 工程师必知的“FEC 悬崖 (FEC Cliff)”效应

在没有 FEC 的老式系统中，随着光纤变长、信噪比下降，误码率是缓缓上升的（画面慢慢变模糊）。但加入了强力的 SD-FEC 后，系统行为发生了根本变化：

当 SNR 高于某个临界阈值时，FEC 能够把成千上万的误码瞬间纠正为 0，系统运行极其完美（Post-FEC BER = 0）。
但当 SNR 哪怕只跌破阈值 0.1 dB，FEC 算法就会突然崩溃，纠错能力瞬间失效，链路直接中断——这就像一脚踩空掉下悬崖。

工程启示：在部署 400G/800G 系统时，你不能看业务“现在是不是通的”，而必须监控 Pre-FEC BER（纠错前误码率），确保它距离“悬崖边缘”留有足够的安全裕量（Margin）。

3.6 模块回顾与承上启下

🎯 模块三：8 个核心要点

光波有四个可调制维度：振幅、频率、相位、偏振。现代高阶调制同时榨取其中三个（频率留给 DWDM）。
OOK + 直接检测是最简单但也最浪费的方式——频谱效率 1 bit/s/Hz，只能用振幅维度。
PAM4 是数据中心短距的主力——保持直接检测的简单性，同时把频谱效率翻倍到 2 bit/s/Hz。
PSK/QAM 必须用相干检测——它们在相位上编码信息，没有 LO 参考就无法恢复。
I/Q 分解是相干调制的数学基础——任何振幅+相位组合都可表示为 I、Q 两个正交分量。
DP-QPSK/16QAM/64QAM 构成了现代 100G/400G/800G 系统的基石——每符号 4/8/12 bits。
香农极限设定了容量天花板——SNR 每加 3dB 只换回 1 bit/s/Hz，高阶调制的代价极其陡峭。
DSP + SD-FEC 是现代光通信的灵魂——色散补偿、PMD 均衡、载波恢复、纠错全部在数字域完成，逼近香农极限。

回到开篇的问题："如果直接检测无法获取相位，那么相干检测怎么实现？调制阶数越高，频谱效率越高，代价是什么？"

✓ 相干检测通过引入本地振荡激光（LO），让信号光与 LO 光干涉，把振幅和相位信息"投影"到 I/Q 两个维度的电信号上，再由 DSP 完成后续处理。
✓ 调制阶数越高，星座图中的点越密集，最小欧氏距离 d_min 越小，对 SNR 的要求越苛刻。工程上，频谱效率翻倍大约需要 6–7 dB 的 SNR 提升——这就是 Shannon 公式 C=B·log₂(1+SNR) 的残酷现实。

术语	英文全称 / 缩写	简要释义
比特	Bit	信息的最小单位，取值 0 或 1。1 bit 代表消除 2 倍不确定性所需的信息量。
带宽	Bandwidth (B)	信道能通过的频率范围，单位 Hz。决定单位时间能传输的信号量上限。
误码率	BER, Bit Error Rate	接收端错误比特数与总传输比特数之比。典型要求 < 10⁻¹² (FEC 后)。
BPSK	Binary Phase Shift Keying	二进制相位键控。用 0 和 π 两个相位表示 1 bit。
C-Band	Conventional Band	1530–1565 nm 波段，光纤衰减最低、EDFA 增益最平坦，DWDM 主力窗口。
色度色散	CD, Chromatic Dispersion	不同波长传播速度不同导致的脉冲展宽。SMF @1550nm ≈ 17 ps/(nm·km)。
相干检测	Coherent Detection	引入本地振荡激光与信号光混频，恢复振幅+相位+偏振完整信息。
星座图	Constellation Diagram	调制符号在 I/Q 复平面的分布图。点数 = 2^(每符号比特数)。
dB / dBm	Decibel / Decibel-milliwatt	对数功率单位。dB 为相对量（功率比），dBm 为绝对量（相对于 1 mW）。
直接检测	DD, Direct Detection	光电二极管直接输出 \|E\|²，仅能解调强度调制信号。
色散	Dispersion	脉冲在光纤中展宽的总称，含模间色散、CD、PMD 三类。
DSP	Digital Signal Processing	数字信号处理。现代相干收发机在电域完成色散/偏振/载波恢复等关键功能。
DWDM	Dense Wavelength Division Multiplexing	密集波分复用。一根光纤同时传输数十至上百个波长信号。（模块六详讲）
EDFA	Erbium-Doped Fiber Amplifier	掺铒光纤放大器。C-Band 信号全光放大器件，跨洋通信的基石。
FEC	Forward Error Correction	前向纠错。加入冗余位使接收端自纠错，无需重传。
傅里叶变换	Fourier Transform	时域与频域互相转换的数学工具。光通信频谱分析的基础。
I/Q 分解	In-phase / Quadrature	正弦波分解为 cos 和 sin 两个正交分量。相干调制的数学表示。
码间干扰	ISI, Inter-Symbol Interference	脉冲展宽至相邻符号区间造成的干扰。色散的主要危害。
LO	Local Oscillator	本地振荡激光。相干接收机的参考光源，决定系统相位噪声底。
多模光纤	MMF, Multi-Mode Fiber	纤芯粗（50/62.5 μm），支持多个模式传播。适合短距、数据中心内部。
数值孔径	NA, Numerical Aperture	NA = √(n₁²−n₂²)。光纤接受光的最大锥角，衡量集光能力。
NRZ / RZ	Non-/Return-to-Zero	OOK 的两种波形。NRZ 不回零、RZ 每符号中间回零。
奈奎斯特带宽	Nyquist Bandwidth	B_min = R_s/2。无 ISI 传输所需最小带宽。
OOK	On-Off Keying	开关键控。最简单的光调制方式：有光=1，无光=0。
OSNR	Optical Signal-to-Noise Ratio	光信号与光噪声（主要来自 EDFA ASE）的功率比。相干系统关键指标。
PAM4	4-Level Pulse Amplitude Modulation	4 电平脉冲振幅调制。数据中心 400G/800G 短距主流。
光子	Photon	光的量子化单位。能量 E = hf。光通信信噪比的最终量子极限。
偏振模色散	PMD, Polarization Mode Dispersion	两正交偏振态传播速度差引起的随机脉冲展宽。现代光纤 ≤ 0.1 ps/√km。
QAM	Quadrature Amplitude Modulation	正交振幅调制。同时调制 I/Q 两路，实现高频谱效率（16/64/256QAM）。
QPSK	Quadrature Phase Shift Keying	四相位键控，4 个相位代表 2 bits。相干系统 100G 基础格式。
瑞利散射	Rayleigh Scattering	光纤微观密度涨落引起的散射损耗，强度 ∝ 1/λ⁴。长波长衰减更低的根源。
折射率	Refractive Index (n)	n = c/v。光在介质中相对真空的速度比。SiO₂ 玻璃 n ≈ 1.46–1.47。
香农公式	Shannon Formula	C = B·log₂(1+SNR)。信道容量的理论极限，光通信的"天花板"。
单模光纤	SMF, Single-Mode Fiber	纤芯细（~9 μm），仅基模传播，消除模间色散。长距通信首选。
信噪比	SNR, Signal-to-Noise Ratio	信号功率与噪声功率之比。决定调制阶数与距离的核心指标。
Snell 定律	Snell's Law	n₁ sin θ₁ = n₂ sin θ₂。光在界面折射的基本定律。
波特率	Symbol Rate (Rs)	每秒传输的符号数，单位 Baud。比特率 = Rs × 每符号比特数。
全内反射	TIR, Total Internal Reflection	入射角大于临界角时光 100% 反射回高折射率介质。光纤导光的物理基石。
V 参数	V-Number	V = (2πa/λ)·NA。V < 2.405 为单模光纤临界条件。
波长	Wavelength (λ)	λ = c/f。光通信主要工作于 1260–1625 nm 近红外窗口。

光与信息的基础

Why — 为什么要从光的本质开始？

What — 光是电磁波

How — 光的波粒二象性

Why — 不是所有光都适合通信

What — 两个黄金窗口

Why — 为什么需要信息论？

What — 先回答：什么是"信息"？

Now — 香农信道容量公式

How — 光如何携带信息？

光纤——光的高速公路

§2.1 光纤的结构与制造

三层同心圆结构

制造工艺：预制棒 + 拉丝

§2.2 全内反射——光纤的物理基石

折射率 (Refractive Index)

Snell 定律

临界角与全内反射

为什么纤芯折射率必须大于包层？——数学推导

数值孔径 (Numerical Aperture, NA)

§2.3 多模 vs 单模光纤

模式 (Mode) 的概念

V 参数（归一化频率）

多模光纤分类 (OM 等级)

单模光纤标准

多模光纤 vs 单模光纤——全方位对比

§2.4 衰减——信号的能量代价

衰减的三大来源

衰减的量化

§2.5 色散——脉冲展宽的元凶

色散的物理图像

色散的三种类型

① 材料色散(Material Dispersion)

② 波导色散(Waveguide Dispersion)

③ 偏振模色散(PMD)

色度色散 (CD) 详解

偏振模色散 (PMD)

色散补偿策略（预告）

§2.6 非线性效应——光纤的"力量极限"

Kerr 效应

另一大类非线性：受激散射（Stimulated Scattering）

§2.7 模块回顾

🔑 8 个核心要点

调制与解调

What — 什么是调制？

Why — 为什么必须调制？

How — 光波的四个可调制维度

What — OOK 是什么？

How — OOK 的两种波形：NRZ vs RZ

Why — OOK 的致命弱点

3.3.1 PAM4——让光的亮度有 4 个台阶

What

Why

3.3.2 PSK——在"相位"上做文章

BPSK（Binary PSK，二进制相位键控）

QPSK（Quadrature PSK，四相位键控）

3.3.3 QAM——同时控制"亮度"和"相位"

What — I/Q 分解

16QAM 星座图

3.3.4 偏振复用——让容量再翻倍

综合计算示例

3.4.1 傅里叶变换——时域与频域的桥梁

3.4.2 奈奎斯特定理——带宽的绝对下限

奈奎斯特脉冲成形（Nyquist Pulse Shaping）

3.4.3 香农极限——容量的理论天花板（再探）

3.4.4 星座图与欧氏距离——调制的"命门"

3.4.5 PCS——让星座点"有轻有重"的现代魔法

3.5.1 直接检测（Direct Detection, DD）

3.5.2 相干检测（Coherent Detection）

现实中的相干光模块：一张能运行 DSP 的"小板子"

3.5.3 前向纠错（FEC）——最后的信号守护神

常见误解与陷阱 Common Misconceptions

理解自测 Check Your Understanding

公式速查 Formula Index

旅程的第一站，结束于此

术语表 Glossary

① 材料色散
(Material Dispersion)

② 波导色散
(Waveguide Dispersion)

③ 偏振模色散
(PMD)