- 博客(1)
- 收藏
- 关注
如何估计搜索引擎索引的网页数
记两个词a,b,假设两个词在网页中出现的概率是独立的. 设含a的网页数为A,含b的为B,同时含a,b的为I. 全部的网页数为S P(a)为随机网页中出现a的概率, P(a,b)为同时出现a,b的概率 则 P(a,b)=P(a)*P(b) -> I/S=A/S*B/S -> S=A*B/I 估计出S后可以验证单词a,b的独立性是否满足: P(a|b) = P(a) I/B = A/...
2009-01-26 18:15:04 881
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人