# 交叉熵是用来度量两个向量之间距离的方法 D(s,L)=−∑iLilog(si) 初始化输入 一个好的指导原则是输入变量均值为零和尽可能同方差 Mean Xi=0 Variance σ(Xi)=σ(Xj) 初始权重 比较好的方法是从一个小的 σ 开始