今天看的论文-blog的排序

最新推荐文章于 2023-12-23 14:17:02 发布

Dooz0

最新推荐文章于 2023-12-23 14:17:02 发布

阅读量199

点赞数

分类专栏： Machine Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Dooz0/article/details/79337551

版权

Machine Learning 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

web搜索排序
PageRank
HITS

贝叶斯分类器的原理
常见的基于统计的分类方法有：

支持向量机（SVM）

最近邻（K-nearest)

距离回归方程的距离

余弦相似度

贝叶斯（听说谷歌的面试要考--）

特征统计

PageRank：
1、从网页指向另一个网页的连接是一种对目标网页重要性的隐含的认可，也就是说，如果一个网页指向它的连接越多，则其重要性越高。
2、由于指向网页i的网页本身也有重要性的高低，一个重要性比较高的网页指向i比一个重要性比较低的网页指向i更能说明i的重要性。就是说，如果某个网页被一些重要的网页链入了，那么这个网页更重要。->带权重的有向图。

HITS算法：
将搜索字段q提交给搜索引擎系统进行查询，将t个排名最高的网页搜集过来，这些嗯和查询高相关的网页集合记为根集w

将指向w集内部的网页和w集指向外部的网页加入w集，以此来扩充w从而得到一个更大的集合s。正常情况下为了限制s的大小，只允许内部网页最多将k个指向自己的网页带入s。为每个网页指定-权威分值和中心分值。

只是大略的看了下，感觉blog排序就是基于一种词法分析和特征统计，这和机器学习的分类的算法是一个道理。机器学习真的就是统计学和计算机的结合啊。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
今天看的论文-blog的排序

web搜索排序PageRankHITS贝叶斯分类器的原理常见的基于统计的分类方法有：支持向量机（SVM）最近邻（K-nearest)距离回归方程的距离余弦相似度贝叶斯（听说谷歌的面试要考--）特征统计PageRank：1、从网页指向另一个网页的连接是一种对目标网页重要性的隐含的认可，也就是说，如果一个网页指向它的连接越多，则其重要性越高。2、由于指向网页i的网页本身也有重要性的高低，一个重要性比较...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。