信息论课程笔记
约 1462 字大约 5 分钟
信息论课程笔记
一、 引言:三条重要的物理学公式
信息论奠基人香农提出的信息熵公式,与另外两条物理学基石公式同等重要:
- 质能方程 (E=mc²)
- 核心:揭示了物质与能量的统一性,是科学思维化繁为简的典范。
- 信息熵公式 (香农提出)
- 核心:解决了信息的量化问题,是信息论的基础,也是本节课程的主题。
- 海森堡测不准原理
- 核心:界定了科学的边界,指出在微观世界,观察行为本身会改变被观察对象的状态,不存在绝对客观的观察。
二、 能量与信息的根本区别
- 能量守恒:能量不会凭空产生或消失,只会转化或转移,总量保持不变。
- 信息不守恒:信息可以被无限复制和分享。知识分享能创造纯粹的增量(分享者知识未减少,接收者知识增加)。
三、 核心概念:信息熵与信息量
1. 信息熵
- 定义:描述一个系统或事件不确定程度的量。直观理解为“搞清楚某件事的难度”。
- 影响因素:
- 可能状态的数量:可能结果越多,熵越大。
- 概率分布:在状态数量固定时,各状态出现概率越平均(越均衡),熵越大;某个状态概率越突出(越不均衡),熵越小。
- 例子:
- 100%确定的事件(如已知结果的抽奖),熵为0。
- 各结果概率均等(如抛硬币),熵最大。
2. 信息量
- 定义:消除不确定性(熵)所需要的信息。香农定义了基本单位:比特。
- 启发:模棱两可(如“随便”)创造了最大的不确定性,需要最多的信息量来消除。明确的表态或选择能有效降低不确定性。
四、 关键模型与方法论
1. 霍夫曼编码
- 原理:一种数据压缩编码方法。将较短的编码分配给高频出现的符号,将较长的编码分配给低频出现的符号,从而实现整体表达效率的最优化。
- 例子:摩尔斯电码将最简单的代码(如“E”是一个点)分配给最常用的字母。
- 生活启示(资源配置):应将最重要的资源(时间、金钱、注意力)分配给生活中最高频出现的场景。
- 正面例子:为高频使用的工作区、阅读区、手机/电脑配置优质资源。
- 反思例子:为低频穿着的衣服配置过多金钱可能是一种浪费。
2. 帧间压缩算法
- 原理:视频压缩技术。不独立压缩每一帧,而是只处理相邻帧之间的变化部分(信息增量),忽略重复的背景信息,从而极大提升压缩效率。
- 启发(学习与效率):
- 关注增量,而非存量:在已有扎实基础的前提下,学习新知识时只需重点关注新增部分。
- 打好基础是关键:在某个领域的“第一帧”(基础知识框架)处理得越扎实,后续理解相关增量信息的效率就越高。
- 阅读方法应用:结合霍夫曼编码(在基础、深刻的理论上花更多时间)与帧间压缩(只关注新书的增量信息),可实现高效阅读。
3. 互信息
- 定义:衡量两个随机变量之间相关性强弱的指标。互信息越大,相关性越强。
- 核心区分:相关性不等于因果性。信息论和数据科学擅长发现相关性,而非确定因果。
- 启发:
- 真实世界中许多联系是相关关系,而非因果关系。
- 应警惕成功经验分享中常见的“因果幻觉”,很多归因可能混淆了相关与因果。
- 应用:互联网个性化推荐(如标签系统)利用的是用户行为与内容类别的相关性。
4. 冗余度
- 定义:信息中重复或非必要的部分。在工程领域指为保障系统安全可靠而故意增加的备份资源。
- 双重性:
- 必要价值:适度的冗余符合人类认知习惯(如标点符号、故事叙述),能降低接收信息的难度,防止因走神丢失关键信息。
- 效率负担:过高的冗余(如冗长的背景介绍)会降低信息密度,影响效率。
- 趋势:随着信息时代发展,人类(尤其是年轻一代)对冗余的容忍度在降低,更偏好高信息密度的表达(如网络缩写)。
- 成为高密度信息掌握者的方法:构建分析框架。
- 三步法:
- 罗列:零散列出关键概念。
- 关联与简化:寻找概念间关联,进行分类连接,并去除信息等价的冗余部分。
- 建模与套用:调用已有思维模型进行套用和校正,形成新的分析框架。
- 三步法:
总结
本节课从宏观公式对比切入,阐述了信息论的核心思想。核心知识点信息熵量化了不确定性;霍夫曼编码指导我们将资源优先配置给高频场景;帧间压缩算法启示我们关注信息增量以提升效率;互信息强调了相关性思维的重要性,并区分了相关与因果;冗余度则揭示了信息设计中效率与人性化接受的平衡。整体上,信息论提供了一套关于如何高效量化、压缩、传递和理解信息的深刻方法论,其原理可广泛应用于学习、生活和资源配置中。
