特征编码、欠定与超定方程、不确定性与熵

我叫两万块

已于 2022-10-18 10:22:32 修改

阅读量299

点赞数

文章标签： python 机器学习算法

于 2022-10-16 17:22:25 首次发布

本文链接：https://blog.csdn.net/lwk___123/article/details/127308111

版权

特征编码

对不同特征标注01234即可

对不同特征标注0001,0010,0100,1000

四个变量可以用三个变量表示即可，另一个可以通过排除法得到。

由若干个偏微分方程所构成的等式组就称为偏微分方程组，其未知函数也可以是若干个。当方程的个数少于未知函数的个数时，就称为欠定的。当方程的个数超过未知函数的个数时，就称这偏微分方程组为超定的。

信息熵：表示的是信息量的大小，信息不确定性的大小，把事情弄清楚的次数。

$Ent\left( f\right) =-\int_{-\infty}^{+\infty}{f\left( x \right) \log _af\left( x \right) dx}$
f（x）为概率密度函数。
联合熵
条件熵
交叉熵
主要用于度量两个概率分布间的差异性信息。
可用于训练样本集总体样本的分布估计与真实分布的差异性！交叉熵越大，误差越大。
$Ent\left( f_0,f_1 \right) =-\int_{-\infty}^{+\infty}{f_0\left( x \right) \log _af_1\left( x \right) dx}$
吉布斯不等式：交叉熵恒大于等于信息熵
相对熵（也叫KL散度）
$D_{KL}\left( f_0||f_1 \right) =Ent\left( f_0,f_1 \right) -Ent\left( f_0 \right)$
相对熵越小，也就等同于Ent（f0，f1）越小
互信息
不确定性的减少量。Ent(Y|X)表示给了提示信息X的Y的不确定性度量
$I\left( Y;X \right) =Ent\left( Y \right) -Ent\left( Y|X \right)$
信息增益
信息增益

实际上就是信息熵减去条件熵。
增益率