作弊的本质是:在网页排名信号中,加入噪音,反作弊的关键是,去除噪音。
早期作弊方法:重复关键词,卖链接。
针对商业相关的搜索,采用一套 抗干扰 强的搜索算法。
出链向量间余弦距离几乎为1(卖链接)。
作弊网站需要相互链接,形成一个Clique,互联网大图中有一些Clique,用图论知识解决。
作弊的本质是:在网页排名信号中,加入噪音,反作弊的关键是,去除噪音。
早期作弊方法:重复关键词,卖链接。
针对商业相关的搜索,采用一套 抗干扰 强的搜索算法。
出链向量间余弦距离几乎为1(卖链接)。
作弊网站需要相互链接,形成一个Clique,互联网大图中有一些Clique,用图论知识解决。