查询扩展
在自然语言文本中,描述同一个主题的词项倾向于共同出现在与该主题相关的文档中。根据这一现象,可以利用词项之间的共现信息来选取扩展词。
term ws, term wt, document D, collection S with size n.
其中
df(.|C)表示S中出现某个词项的文档的数目,μ为一个大于0的可调参数,缺省值为100。
参考:基于统计语言建模的信息检索及相关研究
查询扩展
在自然语言文本中,描述同一个主题的词项倾向于共同出现在与该主题相关的文档中。根据这一现象,可以利用词项之间的共现信息来选取扩展词。
term ws, term wt, document D, collection S with size n.
其中
df(.|C)表示S中出现某个词项的文档的数目,μ为一个大于0的可调参数,缺省值为100。
参考:基于统计语言建模的信息检索及相关研究