第五章 曲线和曲面
函数的输入可以是多个值(也称参数)
输出也可以是多个值(有时称为返回值)
1 重点
判断一个特定的点沿着曲线、曲面移动 并得到一个更大、更小的输出。
前提 曲线是 连续 平滑 单值
2 导数
- 寻找一条曲线在完整定义域内最大值或者最小值(此时的最值是全局最值)
- 查找曲线上最大值最小值的位置
- 局部最值(创建切线)
3 梯度
仍然需要保证区县市光滑 连续 单值
概念 上坡上一滴水最快下落速度的最大下降方向
最大上升方向 在曲面上某个点的邻域内最大上升方向就是最大下降方向的反方向
最大上升方向—梯度 最大下降方向—负梯度
梯度消失 某区域导数为0 没有可以继续上升的方向
鞍部 在一个方向尚处于最高点 在另一个方向上处于最低点
鞍部中央 像同时处于谷底和山顶
鞍部中央点的邻域 想一个平面所以也没有梯度
平坦区域 山顶 山谷 平面 鞍部中央
平坦区域的梯度不存在 梯度消失
第六章 信息论
考虑存在于数据计算过程及结果中的信息差
如何比较不同的数据表示方法的效率
事件四性质
- 比较可能得事件的信息量较少
- 比较不可能事件的信息量较多
- 比较可能得事件相较于不可能事件的信息量较少
- 两个不相关事件的总的信息量是他们各自信息量的总和
可变比特率编码(自适应编码)
任何试图通过匹配编码模式与高概率事件的方法
熵(香农熵)
以比特位单位确定这一个量的值
交叉熵
用一种特定的编码来发送一则消息的每个单词所需要的平均比特数
压缩比
可以告诉我们一种自适应编码能节省多少比特数
压缩比越小 节省比特数越多
KL 散度(Kullback-leibler散度)
别名 鉴别信息 信息散度 有向散度 信息增益 相对熵 KLIC
告诉我们获取通过一种概率分布函数来产生信息的代价是什么
通过一种为另一个不同的概率分布函数所设计的编码表示
特征 KL 散度不是对称的
2023年11月19日17:14:19