可見的幾種Adsense作弊檢測方式- -

 
Adsense反作弊的幾個算法(推測)
牛虻說:
盧先生文中肯定沒有完全說明所有的檢測辦法;而實際上從作弊者的角度考慮也不可能擦除所有的腳印,這是牛虻開發IDS系統時的一個感
覺,所以即使是就盧先生提出的這幾個方向,一個專門的作弊者要想完全掩蓋,也是非常困難的,問題在於,發現問題必須從海量數據中進行分析,所以相信
google也衹能采用選擇某幾個類型進行篩選;而且,必然存在著誤報。因此,這是一個相向的威脅,也是一個相向的約束。但有一條可以肯定:大規模的作弊
比小範?的作弊更容易發現,也更難掩蓋。


作者:盧亮
隨著在線廣告的流行,pay by per click (每次點擊付錢)的模式 逐漸被大家接受。可是隨之而來的問題就是fraud
clicking的預防迫在眉捷,因?這將直接關系到這種廣告模式能否長久生存和能否成?一種真正的網站擁有者的收入來源。

下面介紹Google Adsense系統如何從系統角度出發防止點擊欺騙,希望對其它的在線廣告系統防止虛假點擊能有很好的指導作用:

1] 點擊率 = 點擊次數/共?覽的次數。
點擊率是一個判斷是否有無fraud clicks的關鍵的方法,可以想像一個網站上的廣告的點擊率超過10%將意味這什?。

#of Click/# of Viewed

2] 點擊覆蓋率/獨立IP ,這個分布?如果有;單個IP 的(點擊/?覽)=點擊覆蓋率超出了3倍的系統誤差範圍內將有作弊的嫌疑。

例子,例如來自 129.119.200.1 的用戶?覽了 16個網頁,點擊了4個廣告,而整個廣告的點擊率「從[1]?計算的到」是5%,那?計算得到:
%5 X 16 =~ 1,方差?Sqrt(1) = 1,點擊覆蓋率=4/1 = 4 ,根據數學上高斯分布,這種概率小于萬分之一。

Ratio VS IP distribution

3] 點擊率『點擊覆蓋率』/IP/時間
根據時間序列對點擊率進行分析,如果在某一個時間段上有明顯的峰值,那?這將以?著有潛在的欺騙點擊的可能。

Ratio VS time

4] 網頁load的時間和 廣告點擊時間差的分析,以及每兩次click之間時間差序列的分析
[網頁load的時間和 廣告點擊時間差] 應該是一個泊松分布 possion
distribution,而每兩次click之間的時間差也應該是一個Possion
distribution,如果這個時間用秒記,大于25秒的話基本上呈現高斯分布的形狀。

[time of loading - time of click] distribution VS Possion
[time difference of two clicks] distribution VS Possion/Gaussion

5] 針對Proxy點擊的分析
改變IP進行點擊可以說在以往是最難以解決最難以發現作弊方式,大概國人進行Alexa的Boost時就多半采用了Proxy進行虛假點擊的方法,可是這?只要通過反向監查IP的來源是否是帶有Proxy功能的服務器就可以知道了。

Reverse Proxy check

6] 針對 http_agent的分析
Http_agent/時間 的時間序列的分析,峰值超過3方差需要審查

7] 針對 http_referral 的分析
referral/時間 的時間序列的分析 ,峰值超過3方差需要審查

8] 整體效果上還有一個非常有用的量:
所有用戶的有效的每千次展示費用的均值/獨立IP
這個將能更加直接找到spam clicking 的運行計算機並且予以封殺。

Overall Ratio VS IP
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值