ARTICLE / 安全

对称加密体系：AES底层原理与分组工作模式(ECB/CBC/GCM)深度对比

Updated: 2025-04-01
Reading time: 6 min

在解决了数据的完整性（Hash/MAC）之后，我们来探讨信息的机密性（Confidentiality）。

对称加密（Symmetric Encryption）是人类历史最悠久的加密方式，其核心特征是加密和解密使用同一把密钥。尽管它存在“密钥分发困难”的缺陷，但由于其极高的运算速度，现代互联网中 99% 的实际数据载荷（如 HTTPS 传输的网页、视频流、磁盘全盘加密）都在使用对称加密。

本文将剥开 AES 算法的数学黑盒，并结合 OpenSSL 命令行与经典的安全漏洞（Padding Oracle），深入剖析 ECB、CBC 与 GCM 等工作模式的实战安全差异。

1. 块密码（Block Cipher）的底层逻辑：以 AES 为例

与 RC4 这种按字节逐个加密的“流密码（Stream Cipher）”不同，现代主流的 AES（Advanced Encryption Standard，高级加密标准） 是一种块密码（分组密码）。

它强制将明文切割成固定大小的块（AES 固定为 128 bit，即 16 字节），然后对每一个块进行复杂的数学变换。

1.1 AES 的核心变换网络：SPN 结构

AES 内部是一个由多轮（10轮/12轮/14轮，取决于密钥长度）操作组成的迭代网络。每一轮都包含四个核心步骤，完美体现了密码学泰斗香农提出的**“混淆（Confusion）”与“扩散（Diffusion）”**原则：

SubBytes（字节代换）：通过一个非线性的 S-Box（替换盒），将输入的每个字节映射为另一个字节。（实现混淆，抵抗线性密码分析）
ShiftRows（行移位）：将 4x4 矩阵的各行进行不同偏移量的循环左移。（实现扩散）
MixColumns（列混淆）：在伽罗瓦域（Galois Field）内对矩阵的列进行矩阵乘法运算。（实现极强的扩散，让一个比特的改变迅速影响整个块）
AddRoundKey（轮密钥加）：将当前状态与本轮的子密钥进行异或（XOR）。

只要密钥不泄露，目前没有任何已知的计算方法可以在合理时间内破解 AES（即 AES 是算力安全的）。然而，算法本身的安全，并不代表实际应用的安全。

2. 分组工作模式（Mode of Operation）与致命缺陷

既然 AES 只能加密 16 字节的数据块，那如果要加密 1GB 的电影怎么办？这就需要分组工作模式来决定如何将这无数个 16 字节的块串联起来。绝大多数的密码学漏洞，都出在“工作模式”的错误选择上。

2.1 ECB 模式（电子密码本）：被严禁的“企鹅图”模式

底层逻辑：最简单粗暴的模式。将明文切块后，每个块独立使用相同的密钥进行 AES 加密。

💻 日常接触：为什么 ECB 极度不安全？ 假设我们要加密一张 Linux 企鹅（Tux）的位图。由于 ECB 是独立加密的，相同的明文块必然产生相同的密文块。当我们使用 OpenSSL 的 ECB 模式加密这张图片后：
openssl enc -aes-128-ecb -in tux.bmp -out tux_encrypted.bmp -K 00112233445566778899aabbccddeeff
如果你把加密后的文件加上合法的 BMP 头部并打开，你会震惊地发现：企鹅的轮廓依然清晰可见！ 因为大面积相同颜色的像素块（如白色的肚子、黑色的身体）被加密成了相同的密文块，保留了原始数据的统计学特征。在任何现代安全开发中，严禁使用 ECB 模式。

2.2 CBC 模式（密码块链接）：IV 与雪崩效应

为了消除 ECB 的模式特征，CBC 模式引入了初始化向量（IV，Initialization Vector）和链式反应。

底层逻辑：

第一块明文在加密前，先与一个随机的 IV 进行异或（XOR），然后再进行 AES 加密，得到密文块 1。
第二块明文在加密前，先与密文块 1 进行异或，再进行加密，得到密文块 2。以此类推。

安全特性：由于前一个块的密文参与了后一个块的加密，哪怕两个明文块完全一样，只要前面的内容不同（或 IV 不同），产生的密文也截然不同。这彻底消除了数据特征。

2.3 CTR 模式（计数器模式）：将块密码变为流密码

底层逻辑：不再直接加密明文。而是将 Nonce（随机数） + Counter（递增计数器） 作为输入进行 AES 加密，生成一串“伪随机密钥流”。然后将这个密钥流直接与明文进行 XOR，得到密文。

优势：支持多线程并行加密/解密（因为每个块的计数器是独立的，不需要等上一个块算完），性能极高。

3. 复杂环境下的高阶攻击：Padding Oracle (填充神谕攻击)

既然 CBC 模式这么安全，为什么现在也不推荐使用了呢？因为它存在一个致命的软肋——填充（Padding）与解密时的错误回显。

3.1 PKCS#7 填充规则

AES 强制要求块大小为 16 字节。如果最后一块明文只有 13 字节怎么办？ PKCS#7 标准规定：缺几个字节，就填充几个相同的字节。

缺 3 字节，就填充 0x03 0x03 0x03。
缺 1 字节，就填充 0x01。
刚好 16 字节？必须额外追加一个完整的 16 字节块，全部填充 0x10。

3.2 攻击原理实战解剖

在很多 Web 框架（如早期的 ASP.NET、Shiro）中，服务端接收到用户发来的 CBC 密文（如 Cookie）后进行解密。解密后，它会检查最后的 Padding 是否合法（比如最后一位是 0x03，那倒数三位必须都是 0x03）。

合法：业务继续处理，返回 HTTP 200 或业务错误。
不合法：抛出密码学异常，返回 HTTP 500。

黑客如何利用？ 攻击者截获了密文，他不知道密钥。但他可以故意篡改密文倒数第二块的某个字节，然后发送给服务器。

服务器解密最后一块时，由于倒数第二块（作为 IV）被篡改，解密出的明文也会改变，导致 Padding 被破坏。
服务器返回 HTTP 500。
攻击者不断遍历这个字节的 256 种可能（0x00 到 0xFF），只要碰到服务器不报错（返回 HTTP 200），就说明此时解密出的 Padding 恰好是合法的（比如碰巧是 0x01）。
结合异或运算的数学性质，攻击者可以通过这个“神谕（Oracle，指服务器的报错反馈）”，在完全没有密钥的情况下，硬生生把明文一个字节一个字节地反推出来！

4. 现代标准：AEAD 与 GCM 模式

4.1 为什么需要 AEAD？

Padding Oracle 攻击之所以能成功，根本原因在于 CBC 模式只保证了机密性，没有保证完整性。攻击者可以随意篡改密文并让服务器去解密。

为了解决这个问题，现代密码学引入了 AEAD（Authenticated Encryption with Associated Data，认证加密） 的概念：在加密的同时，生成一个类似 HMAC 的认证标签（MAC/Tag）。解密前，先校验标签，如果密文被篡改过，标签校验直接失败，根本不会进入解密和 Padding 检查环节。

4.2 AES-GCM：当今互联网的绝对主力

GCM（Galois/Counter Mode） 是目前 TLS 1.3、SSH、IPsec 中最推荐的加密模式。

加密部分：采用 CTR 模式，支持并行计算，速度极快，且不需要 Padding（因为是流密码模式的 XOR），天然免疫 Padding Oracle 攻击。
认证部分：采用基于伽罗瓦域乘法的 GMAC 算法，计算出一个 16 字节的 Authentication Tag。

💻 实战接触：查看 HTTPS 连接的底层加密套件 打开浏览器控制台，查看当前网页的证书安全信息，你大概率会看到类似这样的字眼： TLS_AES_128_GCM_SHA256 或 TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384 这里的 GCM 就是在宣告：你的流量正受到当今最高标准、防篡改、防 Padding Oracle 攻击的保护。

5. 总结

对称加密是数据的铠甲。作为安全工程师或开发人员：

绝对禁止自己发明加密算法，只能使用 AES、ChaCha20 等经过全球密码学家考验的标准。
绝对禁止使用 ECB 模式。
尽量避免使用 CBC 模式，除非你能在外部严格叠加 HMAC（即 Encrypt-then-MAC）以防止 Padding Oracle 攻击。
无脑首选 AES-GCM 或 ChaCha20-Poly1305 等 AEAD 认证加密模式。

下一篇预告：对称加密虽然快且安全，但它无法解决“第一次通信时，双方如何安全地协商出那把唯一的密钥”这个千古难题。下一篇，我们将踏入人类数学的巅峰殿堂：【非对称加密与密钥交换】，解密 RSA 的大素数分解、ECC 椭圆曲线，以及 Diffie-Hellman (DH) 机制是如何在黑客的全程监听下，凭空“变”出共享密钥的！