Bonferroni's Principle:避免假阳反馈的统计学的方法,该规则让我们将随机现象当做规律。非形式化描述:如果在随机情况下,某事件的期望值远远大于希望找的实例数目,那么发现的现象极有可能是假的。即我们应该寻找那些在随机情况下出现概率很小的事件而忽略那些在随机情况下期望很大的事件。
寻找文档中的关关键词时,可以使用TF.IDF,最高值最能特性化该文档。
Bonferroni's Principle:避免假阳反馈的统计学的方法,该规则让我们将随机现象当做规律。非形式化描述:如果在随机情况下,某事件的期望值远远大于希望找的实例数目,那么发现的现象极有可能是假的。即我们应该寻找那些在随机情况下出现概率很小的事件而忽略那些在随机情况下期望很大的事件。
寻找文档中的关关键词时,可以使用TF.IDF,最高值最能特性化该文档。