今天看的论文-blog的排序

web搜索排序
PageRank
HITS


贝叶斯分类器的原理
常见的基于统计的分类方法有:

支持向量机(SVM)


最近邻(K-nearest)

距离回归方程的距离

余弦相似度


贝叶斯(听说谷歌的面试要考--)


特征统计


PageRank:
1、从网页指向另一个网页的连接是一种对目标网页重要性的隐含的认可,也就是说,如果一个网页指向它的连接越多,则其重要性越高。
2、由于指向网页i的网页本身也有重要性的高低,一个重要性比较高的网页指向i比一个重要性比较低的网页指向i更能说明i的重要性。就是说,如果某个网页被一些重要的网页链入了,那么这个网页更重要。->带权重的有向图。


HITS算法:
将搜索字段q提交给搜索引擎系统进行查询,将t个排名最高的网页搜集过来,这些嗯和查询高相关的网页集合记为根集w

将指向w集内部的网页和w集指向外部的网页加入w集,以此来扩充w从而得到一个更大的集合s。正常情况下为了限制s的大小,只允许内部网页最多将k个指向自己的网页带入s。为每个网页指定-权威分值和中心分值。


只是大略的看了下,感觉blog排序就是基于一种词法分析和特征统计,这和机器学习的分类的算法是一个道理。机器学习真的就是统计学和计算机的结合啊。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值