熵
相对熵
简介
相对熵又叫KL散度,其数值衡量两个分布 p ( x ) p(x) p(x)和 q ( x ) q(x) q(x)之间差异,相对熵具有两个重要的属性:非负性(即 K L ( p ∣ q ) ≥ 0 KL(p|q)≥0 KL(p∣q)≥0)和非对称性(即 K L ( p ∣ q ) ≠ K L ( p ∣ q ) KL(p|q)≠KL(p|q) KL(p∣q)=KL(p∣q))
公式
D K L ( p ∣ q ) = ∑ i [ p ( x i ) l o g ( p ( x i ) ) − p ( x i ) l o g ( q ( x i ) ) ] = ∑ i p ( x i ) l o g ( p ( x i ) q ( x i ) ) D_{KL}(p|q)=∑_i[p(x_i)log(p(x_i))-p(x_i)log(q(x_i))]=∑_ip(x_i)log(\frac {p(x_i)}{q(x_i)}) DKL(p∣q)=i∑[p(xi)log(p(xi))−p(xi)log(q(xi))]=i∑p(xi)log(q(xi)p(xi))
交叉熵
简介
交叉熵其实是相对熵减号右边的一部分,而又因为相对熵减号左边的部分是一个常数(真实分布的熵)所以神经网络一般将交叉熵作为损失函数,等价于将相对熵作为损失函数。
公式
H ( p , q ) = ∑ i [ p ( x i ) l o g ( q ( x i ) ) ] H(p,q)=∑_i[p(x_i)log(q(x_i))] H(p,q)=i∑[p(xi)log(q(xi))]
定律
齐普夫定律(Zipf定律)
简介
该定律是一个词频分布定律,设一篇长文章n个词出现的频次分别为 f 1 , f 2 , . . . , f n , f_1,f_2,...,f_n, f1,f2,...,fn,则 i ∗ f i = C i*f_i=C i∗fi=C, C C C为一个常数。
图
无标度网络
简介
网络节点度的分布符合幂律分布的复杂网络为无标度网络,即少数节点拥有大量的连接。