一个单词出现的频率与它在频率表里的排名成反比。
齐普夫定律(Zipf’s Law):一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的 词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。
用公式表示,就是 r × f = C 。(此处的C一般认为取0.1)
一个单词出现的频率与它在频率表里的排名成反比。
齐普夫定律(Zipf’s Law):一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的 词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。
用公式表示,就是 r × f = C 。(此处的C一般认为取0.1)