经典概率论的线性代数(矢量)表示
约 1156 字大约 4 分钟
经典概率论的线性代数(矢量)表示
一、课程目标与预备知识
- 目标:学习用线性代数(矩阵/矢量)的数学符号重新表述经典概率论,为后续理解量子理论奠定形式数学基础。
- 预备知识:仅需“古典概型”概率论,即对等概率事件进行计数计算概率。
二、古典概型回顾
- 概率定义:对于等概率基本事件,概率 = (满足条件的事件数) / (所有可能的事件数)。
- 例:六面骰子出“1”的概率 = 1/6。
- 概率的频率解释:在大量重复试验中,事件发生的频率会趋近于其概率。
- 均值(期望值)计算:每个可能结果的收益乘以其概率,再求和。
- 例:骰子点数<3赢10元,>3输20元,平均收益 = (10×1/6 + 10×1/6 + 10×1/6) + (-20×1/6 + -20×1/6 + -20×1/6)。
三、概率论的两条基本性质
- 互斥事件的加法
- 若事件A与B互斥(不能同时发生),则事件“A或B”的概率 P(A∪B) = P(A) + P(B)。
- 关键:必须验证事件互斥(即无交集)。若非互斥,需还原到基本事件集合进行计算,不可直接概率相加。
- 独立事件的乘法
- 若事件A与B独立,则事件“A与B同时发生”的概率 P(A∩B) = P(A) × P(B)。
四、概率状态的线性代数表示
引入狄拉克符号 |状态⟩ 和矩阵表示来描述概率分布。
1. 状态的表示
- 一个概率分布(状态)
ρ可表示为一个对角矩阵:或写成矩阵形式(以两态系统为例,如硬币):ρ = P₁|1⟩⟨1| + P₂|2⟩⟨2| + ...[P₁ 0] ρ = [ ] [0 P₂]|i⟩⟨i|表示系统处于状态i。Pᵢ是系统处于状态i的概率。
2. 可观测量(算符)的表示
- 一个物理量(如收益规则)
A也可表示为一个对角矩阵:或矩阵形式:A = E₁|1⟩⟨1| + E₂|2⟩⟨2| + ...[E₁ 0] A = [ ] [0 E₂]Eᵢ是当系统处于状态i时,该物理量的取值(如收益金额)。
3. 计算规则:正交性
- 基矢量的内积规则(核心):
⟨μ|ν⟩ = δ_{μν}- 其中
δ_{μν}是克罗内克δ函数:当μ = ν时为1,当μ ≠ ν时为0。 - 物理意义:在经典体系中,不同状态是完全互斥、没有“重叠”的。例如,硬币“正面”态与“反面”态正交。
- 其中
4. 均值(期望值)的计算
- 物理量
A在状态ρ下的平均值计算公式为:⟨A⟩ = Tr(Aρ)Tr表示求矩阵的迹(即所有对角线元素之和)。- 计算过程:先将矩阵
A与ρ相乘,再求结果矩阵的迹。 - 验证:此计算的结果
E₁P₁ + E₂P₂ + ...与传统概率论求期望值的公式完全一致。
5. 状态的操作(演化)
- 若要对系统状态进行一个操作(如翻转硬币),该操作由一个矩阵
U描述。 - 操作后,新的状态
ρ'由下式给出:ρ' = U ρ U†U†是U的共轭转置(在实矩阵情形下即为转置)。
- 例:
- 不变操作:
U = I(单位矩阵)。 - 翻转操作:
U = [[0,1],[1,0]]。作用于纯正面态[[1,0],[0,0]]后,得到纯反面态[[0,0],[0,1]]。
- 不变操作:
五、测量后状态
- 逻辑思辨:对一个随机系统进行测量,在测得某个特定结果的瞬间,系统就处于该结果对应的状态。
- 数学表示:可通过对应的投影算符作用到状态
ρ上得到测量后的状态(具体公式在课程中提及,核心思想与逻辑一致)。 - 重要性:这是经典世界认知的基础——测量揭示了系统本来的状态。
六、核心公式小结
- 正交性:
⟨μ|ν⟩ = δ_{μν}(经典体系的核心特征)。 - 状态:
ρ = diag(P₁, P₂, ...)(对角矩阵,元素为概率)。 - 可观测量:
A = diag(E₁, E₂, ...)(对角矩阵,元素为取值)。 - 期望值:
⟨A⟩ = Tr(Aρ)。 - 状态操作:
ρ' = U ρ U†。
总结
本次课程将经典概率论的全部计算(概率分布、期望值、状态操作)用一套线性代数(矩阵)语言重新表述。这套表述在经典语境下看似更复杂,但其计算规则(特别是求迹公式)与传统概率论结果完全等价。引入这套形式体系的关键目的是为了后续课程铺垫:只需修改最核心的“正交性”规则(即允许状态叠加),而保持其他所有数学形式不变,即可自然过渡到量子理论的描述框架。
