98、搜索引擎反作弊的一些方法

这篇也是在阅读了吴军老师的《数学之美》一书后,所写的一些笔记

下面来引用书中的一些搜索引擎反作弊的一些方法:

他们发现通信模型对于搜索反作弊依然适用。

在通信中解决噪音干扰问题的基本思路有两条

1、从信息源出发,加强通信(编码)自身的抗干扰能力

2、从传播来看,过滤掉噪音,还原信息

(1)搜索引擎作弊从本质上看就如同对(搜索)排序的信息加入噪音,因此反作弊的第一条是要增强排序算法的抗噪声能力。

(2)其次是像在信号处理中去噪音那样,还原原来真实的排名。

那些卖链接的网站,都有大量的出链,而这些出链的特点与不作弊的网站的出链相比,特点大不相同

每一个网站到其他网站的出链数目可以作为一个向量,它是这个网站固有的特征。

(1)可以计算这些向量的余弦距离,有些网站的出链向量之间的余弦距离几乎为1,一般来讲,这些网站通常是一个人建的,

目的只有一个:卖链接。发现了这个规律后,改进PageRank算法,使得购买的链接基本上不起作用

 

(2)反作弊的另一个工具是图论。在图中,如果有几个节点两两互相都链接在一起,被称为一个环

作弊的网站一般需要互相连接,以提高自己的排名。这样在互联网这张大图中就形成了一些环

图论中有专门的发现环的方法,可以直接应用到反作弊中。

转载于:https://www.cnblogs.com/weizhen/p/7675746.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值