所谓新词,需要做到词内凝固度足够高,左右相邻字自由度足够高。 我们使用点互信息(pointwise mutual information)来衡量凝固度,使用信息熵来衡量自由度。
互信息
PMI = p(x,y) / (p(x)p(y))
互信息其实就是对X和Y的所有可能的取值情况的点互信息PMI的加权和
所谓新词,需要做到词内凝固度足够高,左右相邻字自由度足够高。 我们使用点互信息(pointwise mutual information)来衡量凝固度,使用信息熵来衡量自由度。
PMI = p(x,y) / (p(x)p(y))
互信息其实就是对X和Y的所有可能的取值情况的点互信息PMI的加权和
转载于:https://my.oschina.net/chunquedong/blog/1865208