经典概率论的线性代数（矢量）表示

JavaJuice约 1156 字大约 4 分钟

经典概率论的线性代数（矢量）表示

一、课程目标与预备知识

目标：学习用线性代数（矩阵/矢量）的数学符号重新表述经典概率论，为后续理解量子理论奠定形式数学基础。
预备知识：仅需“古典概型”概率论，即对等概率事件进行计数计算概率。

二、古典概型回顾

概率定义：对于等概率基本事件，概率 = (满足条件的事件数) / (所有可能的事件数)。
- 例：六面骰子出“1”的概率 = 1/6。
概率的频率解释：在大量重复试验中，事件发生的频率会趋近于其概率。
均值（期望值）计算：每个可能结果的收益乘以其概率，再求和。
- 例：骰子点数<3赢10元，>3输20元，平均收益 = (10×1/6 + 10×1/6 + 10×1/6) + (-20×1/6 + -20×1/6 + -20×1/6)。

三、概率论的两条基本性质

互斥事件的加法
- 若事件A与B互斥（不能同时发生），则事件“A或B”的概率 P(A∪B) = P(A) + P(B)。
- 关键：必须验证事件互斥（即无交集）。若非互斥，需还原到基本事件集合进行计算，不可直接概率相加。
独立事件的乘法
- 若事件A与B独立，则事件“A与B同时发生”的概率 P(A∩B) = P(A) × P(B)。

四、概率状态的线性代数表示

引入狄拉克符号 |状态⟩ 和矩阵表示来描述概率分布。

1. 状态的表示

一个概率分布（状态）ρ 可表示为一个对角矩阵：
```
ρ = P₁|1⟩⟨1| + P₂|2⟩⟨2| + ...
```
或写成矩阵形式（以两态系统为例，如硬币）：
```
    [P₁   0]
ρ = [      ]
    [0   P₂]
```
- |i⟩⟨i| 表示系统处于状态 i。
- Pᵢ 是系统处于状态 i 的概率。

2. 可观测量（算符）的表示

一个物理量（如收益规则）A 也可表示为一个对角矩阵：
```
A = E₁|1⟩⟨1| + E₂|2⟩⟨2| + ...
```
或矩阵形式：
```
    [E₁   0]
A = [      ]
    [0   E₂]
```
- Eᵢ 是当系统处于状态 i 时，该物理量的取值（如收益金额）。

3. 计算规则：正交性

基矢量的内积规则（核心）：
```
⟨μ|ν⟩ = δ_{μν}
```
- 其中 δ_{μν} 是克罗内克δ函数：当 μ = ν 时为1，当 μ ≠ ν 时为0。
- 物理意义：在经典体系中，不同状态是完全互斥、没有“重叠”的。例如，硬币“正面”态与“反面”态正交。

4. 均值（期望值）的计算

物理量 A 在状态 ρ 下的平均值计算公式为：
```
⟨A⟩ = Tr(Aρ)
```
- Tr 表示求矩阵的迹（即所有对角线元素之和）。
- 计算过程：先将矩阵 A 与 ρ 相乘，再求结果矩阵的迹。
- 验证：此计算的结果 E₁P₁ + E₂P₂ + ... 与传统概率论求期望值的公式完全一致。

5. 状态的操作（演化）

若要对系统状态进行一个操作（如翻转硬币），该操作由一个矩阵 U 描述。
操作后，新的状态 ρ' 由下式给出：
```
ρ' = U ρ U†
```
- U† 是 U 的共轭转置（在实矩阵情形下即为转置）。
例：
- 不变操作：U = I (单位矩阵)。
- 翻转操作：U = [[0,1],[1,0]]。作用于纯正面态 [[1,0],[0,0]] 后，得到纯反面态 [[0,0],[0,1]]。

五、测量后状态

逻辑思辨：对一个随机系统进行测量，在测得某个特定结果的瞬间，系统就处于该结果对应的状态。
数学表示：可通过对应的投影算符作用到状态 ρ 上得到测量后的状态（具体公式在课程中提及，核心思想与逻辑一致）。
重要性：这是经典世界认知的基础——测量揭示了系统本来的状态。

六、核心公式小结

正交性：⟨μ|ν⟩ = δ_{μν} （经典体系的核心特征）。
状态：ρ = diag(P₁, P₂, ...) （对角矩阵，元素为概率）。
可观测量：A = diag(E₁, E₂, ...) （对角矩阵，元素为取值）。
期望值：⟨A⟩ = Tr(Aρ)。
状态操作：ρ' = U ρ U†。

总结

本次课程将经典概率论的全部计算（概率分布、期望值、状态操作）用一套线性代数（矩阵）语言重新表述。这套表述在经典语境下看似更复杂，但其计算规则（特别是求迹公式）与传统概率论结果完全等价。引入这套形式体系的关键目的是为了后续课程铺垫：只需修改最核心的“正交性”规则（即允许状态叠加），而保持其他所有数学形式不变，即可自然过渡到量子理论的描述框架。