个别网站为了提高自己的alexa排名,想尽了一切方法,下面某网站的alexa排名作弊手段。这才只是冰山一角:
1. QQ病毒,短时间内快速宣传网站。记得一种来自国外的网络营销名词,叫病毒式营销,但是这种营销方法并不是利用病毒宣传,而是形容网站推广的速度象病毒一样扩散。比如免费信箱的推广。 不过,从去年开始,国内出现的真正的病毒营销,肯定让许多老外汗颜。
2. 网页恶意代码: 包括自动修改浏览用户的IE:(包括默认首页,默认搜索设置等)
3. 广告链支持:此网站在刚开始运作就出现在众多广告链前面。
4. 程序控制浏览用户自动下载安装ALEXA工具条。让浏览用户安装ALEXA工具条可以非常有效的提高自己网站的世界排名。 (一个没有流量的网站,如果两个人用装有ALEXA工具条的浏览器每天流量这个网站一百次。也叫刷alexa,此网站的世界排名可以在一个月内轻轻松松的进入前十万名)
5. 疯狂弹出页面加刷新 如果你的机器重了他的毒,只要你打开浏览器,就会弹出四五个它的广告页面,然后一部分自动刷新,然后自动关闭。当你点击进入它内业的时候,同样会弹出四五个页面,其中几个快速刷新,然后自动关闭。
6. 其他作弊手段,由于我不太懂程序,所以我看出来的可能只是冰山一角。
还有人甚至想到了alexa 作弊器 下载一个回去以后它自己就刷alexa玩儿,提高alexa 点击率和alexa星级,这种玩意儿我是没见过,估计也没有。
发送数据包作弊 Alexa工具条的在每次用户浏览时都返回了一串代码,这些代码中大概有9-10个参数,包括网址,浏览方,网速等,一年前曾有人成功的用C写过FreeBSD下的模拟器,但已经是过去式了,Alexa已经成功的通过经常改变算法忽略掉了此种作弊方法,用此类作弊方法往往短期有效,如果在不知情的情况下Alexa改变算法被发觉即会遭到封杀。
7.反编译Alexa工具条 三年前Alexa还不为人所知的时候还可行,现在的Alexa版本加了壳,汇编已经不可逆转和破译了。
8.模拟器作弊 顾名思义 利用软件在服务器端计算参数,并且通过多个客户端来发送并且汇集数据的方法,类似于BT模式,虽然类似于数据包作弊,但是可以成功逃过算法更新,数据单一化等问题。
有幸在网上找到Alexa的工作原理,遂产生萌念,作它一次弊!
·初探:
Alexa排名在前一两年,直至现在,都成了许多站长追求的目标之一,许多论坛的站长都要求他们的版主装上Alexa工具条,以提高自己的网站的排名。
本人在网上有幸看到一篇文章,说的是Alexa的两个DLL文件AlxTB1.dll、AlxRes.dll,其中AlxRes.dll里面放的是大量的脚本、图片、HTML等代码。有兴趣了解的可以到google.com或baidu.com去搜索一下"alexa dll"。
·设想:让网站的用户都安装alexa工具条。
如果你的站点提供一个功能,用户在线的时候,给用户加分,用户用这些分数,可以享受到你的网站提供的服务,那么,你可以设定这样一个机制:只要会员安装了alexa工具条,则在线的时候获得的分数将是没安装的alexa的两倍,或更多。
·问题:怎么判断用户是否安装了alexa工具条?
要判断这个问题,只能通过网页脚本来进行,然后在用户登录时,把值送到服务器。经过本人摸索,AlxRes.dll中的资源,例如脚本,可以通过一个路径来访问,用编辑器打开这个DLL,可以看到所有的脚本。我们通过新建一个HTML页面,在<head>之间插入一个引用脚本资源的<script>,如下:
<script language="javascript" src="res://AlxRes.dll/SCRIPT/dsn.class.js"></script>
dsn.class.js是AlxRes.dll中的其中一个脚本资源,现在我们随便找这个资源里的一个function,只要它能运行就可以,我找到一个比较简单的:
function aborted()
{
return;
}
因为这个方法比较简单,调用也不容易出错。这就好办了,要判断用户端是否安装alexa工具条,写一段脚本:
<script language="javascript" src="res://AlxRes.dll/SCRIPT/dsn.class.js"></script>
<script language="javascript">
function doTryAlexa()
{
try
{
aborted();
return 1;
}
catch(e)
{
return 0;
}
}
</script>
... 下面来测试一下:
<input type="button" value="tryAlexa" οnclick="alert(doTryAlexa())">
如果安装了,提示1,没安装就提示2。
·作弊!
在用户登录页,写上上面的脚本,在页面里放一个隐藏输入域和一段脚本:
<input type="hidden" id="IsAlexaUser" runat=server><script>document.getElementById("IsAlexaUser").value=doTryAlexa()</script>
用户登录后,将值存到数据库中的在线表,或Session中……
·效果:如果能保证每天有200个左右的alexa傀儡在你的网站上比较频繁地活动,5000名以上的排名。
Alexa工具栏使用Toolbar Bands和Browser Help Object技术嵌入IE浏览器。
Alexa Toolbar可以获得当前浏览器的IWebBrowser2接口,通过这个接口就可以对浏览器为所欲为了。不过Alexa Toolbar的实现十分奇怪:它的界面和主程序是用HTML和javascript实现的,这就是大家经常抱怨使用Alexa Toolbar后导致运行变慢的原因。而且Alexa Toolbar中的javascript有许多冗余代码,且有多处的资源泄漏,当用一个IE窗口长时间浏览网页时会消耗大量的系统资源,建议安装Alexa Toolbar的IE用户在一个窗口长时间运行后,关闭再重新运行。
前面说的那些HTML和javascript代码是以资源的形式存在于alxres.dll文件中的,Alexa Toolbar的界面其实就是一个IE窗口,只不过它屏蔽了右键,这个IE窗口通过"res://alxres.dll/..."来加载HTML页面和脚本的。也许你会自作聪明用一些PE文件资源修改工具来修改alxres.dll,以实现修改alexa toobar的代码。不过Alexa Toolbar的设计者早就想到这一点,他们通过对AlxRes.dll进行校验和计算来拒绝加载修改过的Alxres.dll(不过很奇怪,他们为什么不通过加壳的方式来防止修改呢?),这一功能由AlxTB1.dll导出的ChecksumResources函数实现的,AlxRes.dll在加载的过程中会调用这一函数对自己进行校验。破解方法很简单(下面方法仅对7.0.1.52.1201版本有效,其他版本没有测试):用16进制编辑器,如:WinHex等,打开alxres.dll文件,将文件偏移 0x170f 处的2个字节改为 0x90 就行了。
如果你想了解Alexa Toolbar的运行流程,可以修改“res://AlxRes.dll/CHTML/index.html”的231行,将“var g_bDebug=false;”改成“var g_bDebug=true;”就可以了。现在IE加载完alexa toolbar后,会打开一个新的弹出窗口来输出alexa toolbar的调试信息。
现在你可以随心所欲地修改alexa toolbar了,加入后门啦,写入作弊代码啦都可以,不过我还是对前者比较感兴趣。
新版本的 Alexa Toolbar 破解方法
国庆节后,Alexa Toolbar 更新了版本。
以下是关于新版本7.0.1.52.1202的破解方法:
将 AlexaRes.dll 文件偏移 "0x17F6" 处开始的两个字节"0x1175"改为"0x9090"
你可以通过各种16进制编辑器来修改,显示的应该是 "75 11",改为 "90 90"。
修改Alexa Toolbar 造成的任何结果与我无关啊
Alexa Toolbar 内部揭密
关于Alexa排名的作弊方法网上有介绍很多种,不过都是没有用的,至少现在已经没有用了。
10月6日后,Alexa排名规则有了重大的改变,而且一直在变,所以现在很多网站的排名都不稳定(包括作弊的)。而我今天揭密的内容用来作弊的话已经显得不够了。
Alexa Toolbar的大量代码是用HTML和javascript来实现的,资源泄漏问题严重啊,真不知道它的设计者是怎么想的。Alexa Toolbar的程序实现原理在我以前的文章中也多多少少提到过,所以今天就不讲了。今天来讲一讲Alexa Toolbar发送的HTTP请求格式。
下面是Alexa Toolbar发送的GET请求部分:
GET /data/ezdy01DOo100QI?cli=10&dat=snba&ver=7.0&cdt=alx_vw%3D20%26wid%3D16865%26act%3D00000000000%26ss%3D1024x768%26bw%3D775%26t%3D0%26ttl%3D1125%26vis%3D1%26rq%3D2&url=http://20cn.net/~tabris17/ HTTP/1.1
将URL部分解码后得到:
/data/ezdy01DOo100QI?cli=10&dat=snba&ver=7.0& cdt=alx_vw=20&wid=16865&act=00000000000&ss=1024x768& bw=775&t=0&ttl=1125&vis=1&rq=2&url=http://20cn.net/~tabris17/
其中"ezdy01DOo100QI"是aid。
"cli=10&dat=snba&ver=7.0&cdt=alx_vw=20&"这部分是固定值。
wid是个随机数。
act数据包含了Alexa Toobar功能的被使用情况。
ss很明显是屏幕分辨率了。
bw是IE窗口的宽度。
t取值是0或1,和当前IE的window对象还有referrer有关。
ttl是当前页面打开速度,和Site Stats中的Speed有关。
vis表明IE是否显示工具条。
rq是对象计数器。
大家可以看到,URL部分没有什么奥妙之处,很容易伪造。以前要作弊的话只要大量伪造HTTP请求,不停发送就可以了,现在Alexa通过改进排名算法,杜绝了这种作弊方法。
奥妙之处在于Cookie部分,那里面保存了一些你的浏览隐私,所以Alexa把这部分数据加密了,通过一种类似于PGP的加密方法,你可以在Alexa Toolbar的代码中找到这个加密用的公钥 "d9adyz93472kb63z521t6e80wqpi56znb16fya6im3dr3xwe" (好长啊,看起来很难破解的样子)。密钥只有Alexa自己有啊,郁闷!
Alexa作弊大解密
1、Alexa是通过什么来计算流量的?
其实在Alexa的网站上已经说了很清楚了,Alexa通过安装Alexa Toolbar的IE用户的反馈信息来进行统计的。并非有些人所说:Alexa会计算所有穿梭于Internet上的WEB流量,要做到这一点显然是不可能的。
2、Alexa Toolbar的工作原理是怎样的?
Alexa Toolbar是通过BHO技术和Toolbar Bands技术来监视IE行为的,IE浏览器的地址栏的每一次变化都逃不过Alexa的法眼。不过处于安全性考虑,Alexa Toolbar不会统计用户的HTTPS协议的流量。Alexa Toolbar其实就是向http://data.alexa.com发送HTTP请求来发出用户浏览信息的,这个请求的格式我已经破解了。
3、Alexa排名真的可以作弊吗?
绝对可以。但是现在你能在网上搜索到的作弊方法和作弊工具都是无效的。比如有一种方法说能通过MYIE这样的浏览器来刷排名,显然此文的作者并不懂Alexa Toolbar的工作原理,MYIE是不会加载Alexa Toolbar的。AlexaBooster也不行,因为它忽视了aid的生成算法,以及cookie的作用。
4、Alexa会识别作弊行为吗?
Alexa有一套算法来判断收到的信息是否有伪造的嫌疑。
5、Alexa会像google一样对作弊行为进行惩罚吗?
Alexa不像google,它的信息来源Alexa Toolbar的用户,而非网站自身,这些数据的真实性是无法保证的。仅凭这些不可靠的数据而对一个网站进行惩罚是不可能的,因为很有可能有人恶意伪造某个站点的虚假信息来使Alexa惩罚该网站。但是Alexa会忽略有作弊嫌疑的IP发出的数据。
6、网页的自动跳转和自动刷新能提高Alexa排名吗?
你可以在Alexa的网站上找到这么一句话:“Multiple page views of the same page made by the same user on the same day are counted only once.”。所以通过刷新页面来提高访问量是不可行的。而所谓的自动跳转就是:在用户点击一个连接后,先跳转到一个假页面,这个假页面会在1秒或几秒后跳转到真正的目标页面。这种方法看似可行,但是必须考虑加载Alexa Toolbar所需的时间,太短的话Alexa Toolbar是不会发送信息的,改善的方法就是不要在新窗口中打开连接,这样能避免新的IE窗口因加载Alexa Toolbar所耗费的时间。
Alexa是否真的针对作弊者而改变了排名规则?
经过10.1的7天漫漫长假,发现:Alexa网站已经从6号开始有所变动,很多人猜测这是不是为了针对作弊者而使Alexa改变了排名规则?
我到Alexa网站上看了看,除了以前那个Traffic Rank的图表界面有所变动外,好像找不出其他的迹象了。
很多人认为近几天,一些中国门户网站的排名纷纷开始下降,表明Alexa的排名规则已经变了。其实这只是10.1长假的关系。10.1其间,大家要么出门旅游,要么睡觉休息,上网的话也只是玩网游,哪还有人看网页啊,如果这几天有哪个国内网站的排名不跌的话,那才是有作弊的嫌疑呢。
我个人估计Alexa的排名规则和依据不会有大变动,因为Alexa Toolbar不具备自动升级的功能,所以Alexa排名的数据依据在很长的一段时间内是不会改变的。能改变的只有排名的算法,顶多是改变了Reach和Page View对Rank影响的权重,或是对Reach和Page View出现异常的处理机制。
Alexa工具栏竟然会自动升级
本来一直以为 Alexa Toolbar 没有自动升级功能的,今天突然发现被我修改过的 Alexa Toolbar 竟然恢复正常状态了。我到系统目录下一看,原来被我修改的过的AlxRes.dll的大小是340k变成了336k,而且系统目录下多出了一个AlxRes.dll.bak的文件。我查看了一下Alexa Toolbar的版本信息,原来是“7.0.1.52.1201”,现在变成了“7.0.1.52.1202”。很明显,Alexa自动升级了。
可以肯定,那个新的AlxRes.dll来源于Alexa网站。我粗略地分析了一下Alexa的升级过程:在注册表的“HKEY_LOCAL_MACHINE/SOFTWARE/Alexa Internet”分支下存放了一个名为“lastupdate”,这个值存放了最后一个更新的日期。Alexa Toolbar 被加载时会检查这个键值,当改值的日期与当前日期相差CHECK_UPDATE_INTERVAL这个值的时候,Alexa Toolbar便从远程启动。
Alexa Toolbar在启动时首先加载"res://AlxTB1.dll/CHTML/BOOTSTRAP.HTML",这个页面中的代码会判断是否需要更新Alexa Toolbar,如果不需要,则跳转到"res://AlxRes.dll/CHTML/index.html",如果需要更新,则跳转到http://client.alexa.com/holiday/script/index.html。这就是所谓的远程启动了。
然后AlxTB1.dll会调用URLDownloadToFile函数来下载更新的程序文件。有一点要指出:Alexa Toolbar 只需要更新AlxRes.dll文件就可以了,因为Alexa Toolbar的主要代码都在这个文件里。
最后还要告诉大家一个好消息:这次更新并没有改变数据的收集方式,数据的格式还是和以前一样的。
Alexa是通过什么来计算流量的?
其实在Alexa的网站上已经说了很清楚了,Alexa通过安装Alexa Toolbar的IE用户的反馈信息来进行统计的。并非有些人所说:Alexa会计算所有穿梭于Internet上的WEB流量,要做到这一点显然是不可能的。
2、Alexa Toolbar的工作原理是怎样的?
Alexa Toolbar是通过BHO技术和Toolbar Bands技术来监视IE行为的,IE浏览器的地址栏的每一次变化都逃不过Alexa的法眼。不过处于安全性考虑,Alexa Toolbar不会统计用户的HTTPS协议的流量。Alexa Toolbar其实就是向http://data.alexa.com发送HTTP请求来发出用户浏览信息的,这个请求的格式我已经破解了。
3、Alexa排名真的可以作弊吗?
绝对可以。但是现在你能在网上搜索到的作弊方法和作弊工具都是无效的。比如有一种方法说能通过MYIE这样的浏览器来刷排名,显然此文的作者并不懂Alexa Toolbar的工作原理,MYIE是不会加载Alexa Toolbar的。AlexaBooster也不行,因为它忽视了aid的生成算法,以及cookie的作用。
4、Alexa会识别作弊行为吗?
Alexa有一套算法来判断收到的信息是否有伪造的嫌疑。
5、Alexa会像google一样对作弊行为进行惩罚吗?
Alexa不像google,它的信息来源Alexa Toolbar的用户,而非网站自身,这些数据的真实性是无法保证的。仅凭这些不可靠的数据而对一个网站进行惩罚是不可能的,因为很有可能有人恶意伪造某个站点的虚假信息来使Alexa惩罚该网站。但是Alexa会忽略有作弊嫌疑的IP发出的数据。
6、网页的自动跳转和自动刷新能提高Alexa排名吗?
你可以在Alexa的网站上找到这么一句话:“Multiple page views of the same page made by the same user on the same day are counted only once.”。所以通过刷新页面来提高访问量是不可行的。而所谓的自动跳转就是:在用户点击一个连接后,先跳转到一个假页面,这个假页面会在1秒或几秒后跳转到真正的目标页面。这种方法看似可行,但是必须考虑加载Alexa Toolbar所需的时间,太短的话Alexa Toolbar是不会发送信息的,改善的方法就是不要在新窗口中打开连接,这样能避免新的IE窗口因加载Alexa Toolbar所耗费的时
跟alexa斗争,国内alexa作弊三个时代的顶尖高手
大概2年前,第一次听说alexa这个东西。我去研究了一下这个东西,发现它的排名大致能反映一个网站的访问水平,但也存在一个疑惑,就是有几家韩国网站排在新浪网的前面。然后就有人给我说,那是因为韩国网站安装了一个alexa的工具条。大家安装得多,网站访问也大,所以排名很靠前。我自己也安装了一个,目的不是要某个网站靠前,而是想看看国内哪些网站作得不错。在我的概念,只要进入前10万名的网站,大概访问量还是有一些,应该有一些内容值得我去挖掘。
后来又有人告诉我,通过alexa作弊的中文网站很多。这我也是能理解的。一个靠技术来实现的数据,肯定有人可以通过另一种数据统计方法来使数据不真实。比如当年全国网站评选,都动用民工和学生的省份证,区区一个数字,还能奈何一些疯狂作弊的人。
后来,不断有人说,慧聪在作弊,hao123作弊,3721在作弊,某某金融网站在作弊等。先不管人家作弊到底为了满足什么心理,但这几家被人说作弊的网站,倒都落得一个好下场。比如慧聪上市,hao123和3721被卖等,某某某到美国上市等。看来,alexa是某些上市或被卖的公司实施交易前的第一步。
alexa 作弊从2004年开始,出现三个风云的网站,创造了alexa的神化,.alexa公司也在不同的斗争着
第一个alexa作弊的高手是 www.haodx.com 那时突然的升高 给alexa带来了压力
在短短的一个月alexa公司就将刷新的漏洞补齐,顿时国内很多网站alexa猛掉
看图一
这个alexa的奇迹,不会消磨国内站长的斗智,很块几个月以后,又一批直接冲击alexa credit的数据的作弊站起来,典型 www.88ee.com 一个小小的网址站,迅速在半个月做到世界200名,国内中文站30名,确实让一些技术人员跟it公司汗颜
如图
www.88ee.com 这个算alexa作弊的第二个时代,同时期,一批企业站也在运作作弊alexa,为了卖得更好价格,更有甚者,开始出现了专门作弊alexa的公司和团体.冲刷alexa数据.
alexa 公司在国内毗邻可靠性的边缘
经过3个月的变化,alexa对国内网站,大肆降低指数,同时封杀掉一些网站(几天的数据)
然后对window open 跟iframe 全部失效 .这样alexa在国内平静了进一年的时间.
国内各路高手也在寻找不同的办法跟渠道,想去捍动alexa指数太难了,(国内作弊alexa的高手都各自为政,不相互交流,这个是作弊很难成功的一大难题)
最近www.9991.com 一个小小的网址站,又通过插件结合alexa的作弊,跃进世界200名,揭开了alexa作弊第三个时代的序幕. 看图
不知道这个alexa数据能挺到多久,估计又能催发出一批新的作弊高手.
alexa 走多远,作弊alexa 走多远,高处不胜寒,看看alexa如何以对
昨天,又传天极网在作弊,而且疯狂地作弊。大概alexa是够蠢的,怎么就没想到屏蔽掉中国的所有网站排名呢?要不怎么中国谁想作弊就可以轻易作弊呢?
我不知道天极网下一步是不是真要去美国上市,所以不敢肯定天极网alexa排名从300多名飙升到30多名有没有什么用,我知道,但凡一个网站被人投诉为作弊的网站,大概就真能上市或被出售了。
而就我所理解的天极网,一直在保守的重庆呆着的李志高,不会如此疯狂。我更倾向于有一些人在背后搞鬼,比如那些专做alexa排名升位的人,他们没事挑一家网站搞着玩,也不是没有可能。有一句话“上帝欲让其灭亡,必先使其疯狂”,想必没有人会首先套用在中国alexa作弊网站的身上。而我恰恰觉得,如此作弊的疯狂行为背景之下,就是一些疯狂分子灭亡的前兆。当然,搞作弊搞多了,国人就没人会相信alexa这个好东西了,一个可悲的现象。
alexa 一个可爱的指数,一个可敬的指数,一个热血的指数.大家都来关注他
国内的alexa爱好者也可以自发的组织一下,共同研究这些排行系统.我的qq 470666
alexa 爱你不容易,失去你也不容易,国内站长跟alexa的斗法第4个时代看看谁来领头
在Google上搜索“Alexa”,简体中文的结果有7万多条。现在,“Alexa排名”已经是国内网站的站长们嘴边最常挂的单词。那么,这个Alexa是干嘛的?它 凭什么令国内网站侧目?Alexa有哪些鲜为人知的秘密?本报记者通过深入调查和采访,努力为读者还原一个真实的Alexa,其中很多信息是首次在媒体上披露。
出卖Alexa
写下这个题目,记者还怕有欠妥之处,仔细回想连日来的调查采访,给记者设置迷障的网站,向记者提供帮助的朋友,还有记者自己,都对Alexa投入了极大热情,从某种意义上说,我们也是在共同“出卖Alexa”。
本报记者 王翌
前些天,北京某周刊刚发布了“中国商业网站100强”排行榜,当然,这个排行榜本身就少不了“商业”的味道,但其中对某些网站做介绍时,该媒体竟然又引用了另一个排名数据来说明这些网站的价值,这个被“中国商业网站100强”排行榜引用的排名就是“世界著名的第三方测评机构——美国Alexa”的全球网站排名。当然,该媒体对这个Alexa排名的引用,无非是为了说明其“中国商业网站100强”排名的权威性。而以另一个“权威”来树立自己的“权威”,恰恰说明了该媒体对另一个“权威”——Alexa排名的认可。
Alexa是谁?
1996年4月,Alexa在美国创立,那时它只是一个小网站,主要做分类导航。在那时候,很多网站都是雅虎的Fans,Alexa只是众多跟风者中的一员罢了。但Alexa自己也有一些技术,就是对访问某个Web站点的流量进行统计和分析。后来,Alexa还向网民提供自己开发的搜索引擎服务。
1997年7月,Alexa发布了一款软件,就是现在著名的Alexa Toolbar(Alexa工具条),这是一个嵌入到微软IE浏览器中的工具,它在用户访问每个Web页面时都向Alexa发回一串代码,将该次浏览的相关信息告诉Alexa.而用户会在该工具条上看到其浏览的网站在全球所有网站中的排名信息,当然,这只是Alexa给出的网站排名。
1999年,Alexa被美国电子商务旗舰企业“亚马逊”收购,成为后者的全资子公司。
2002年春,Alexa放弃了自己的搜索引擎,转而与Google合作。Google遍及全球的Web爬行程序构造了一个巨大的页面信息数据库,这极大地丰富了Alexa自身的URL网址数据库。同时,Alexa也偷偷地放出了自己的爬行程序,在互联网上搜寻未知的网址。经过多年积累,Alexa的URL网址库已存储了400亿网址信息,超过了Google等搜索引擎,成为互联网上最全的网址信息数据库。Alexa数据库的每日平均增量高达1TB,每两个月就能对数据库进行一次全面更新。
现在,Alexa工具条在全球的“装机量”早已上千万,而Alexa主要的工作就是基于遍及全球电脑用户桌面的工具条返回的信息,对全球网民的浏览习惯进行监测,并开发和销售各种相关产品。其中,有最长达10万个网址的全球网站排行榜,有针对某些特定行业网站的排行分析,有针对个别网站定制的网站流量监测报告。Alexa还提供了很多免费的基本信息,比如“全球网站500强”,还有“简体中文网站100强”,网民们可以在Alexa上单独查看关于某个网站的排名历史变化图,甚至还能同时对最多5个网站的流量及排名等数据进行直观的横向对比。
尽管Alexa在其网站上提供了非常多有价值的信息,但其真正赖以成名的还是那个被四处引用并被媒体多次炒作过且引发了巨大争议的全球网站排名。按照Alexa网站上的“官方声明”,Alexa公开的那份全球网站总排名是通过收集所有Alexa工具条返回的信息,经过计算得出的综合排名。从这份“官方声明”中,我们不难看出,影响Alexa排名的因素是两个,一是Alexa采集的信息,二是Alexa对这些信息进行深加工的计算方法。
在Alexa网站上,人们可以针对某个特定网址去查询其所属的网站的访问人数,Alexa提供了一个叫做Reach per million users(每百万用户访问人次,简称Reach)的数据来表示访问人数,这个数据指的是每一百万个Alexa工具条用户中每天访问某一网站的平均人数。比如,2004年11月3日,Google.com的Reach值为178,500,就是说,这一天里,每一百万个Alexa工具条用户中就有近18万人访问过Google.com.仅有访问人数,还不足以反映一个网站被网民浏览的情况,Alexa还提供了另一个数据来反映到访的网民对特定网站的使用率,这就是PageViews per user(每用户浏览页面数,简称PV)。某网站的PV值是每天所有访问该网站的Alexa工具条用户在该网站上浏览的总页面数的平均值,而同一人对相同页面的重复浏览在每天只计作一次。还以2004年11月3日Google.com的访问数据为例,这一天,Google.com的PV值是4.0,也就是说,来访的网民们平均在Google.com网站上浏览了4个页面。
有了Reach和PV这两个数据,Alexa就可以给全球网站按综合流量进行排名了,它把网站的这个排名称作Traffic Rank(流量排名,简称Rank),据Alexa在其网站上的解释,决定这个Rank的就是Reach和PV的几何平均数,也就是两者乘积的平方根。显然,一个网站的Reach和PV值越高,其Rank也越高。仍以Google.com为例,其4.0的PV值在一般的网站来说并不算高,但是,由于Google搜索引擎的用户非常多,其Reach值远高于一般的网站,就使得Google.com的Rank达到3,也就是说,Google.com当天的全球排名是第三位。而全球排名最高的网站是yahoo.com,其Reach和PV值在全球网站中都是相对很高的。
利用与怀疑
每时每刻,全球每个安装了Alexa工具条的计算机终端都会向Alexa汇报该终端在互联网上的访问情况。根据这些信息,Alexa每天都会对全球网站的排名做重新计算,也就是说,Alexa排名是每日更新的。因为几乎全球所有的网站都在Alexa的监测范围内,而这个每日更新的排行榜又显得过于直观,加之又是公开的随时可查的数据,就使得Alexa排名在很多场合都显得很敏感。
自2003年以来,国内互联网行业开始全面升温,曾经被资本们无情甩掉的网站CEO们又找回了昔日的感觉,但风险投资家们确实比上一次。COM泡沫时期精明了许多,网站要吸引投资,必须首先打消资本的顾虑,就算是已经上了市的网站,也需要给股东们一些明确的数据来表明自身的价值。就在这时,Alexa排名被介绍到了国内,虽然这个网站以前从未引起大家的注意,但是它提供的这个排行榜却很快显示出巨大的商业价值。
一些网站在向投资人递交商业计划书的同时,开始有意无意地提一下自己的Alexa排名,按照某种大家默认的逻辑,排在全球300名的网站总是比排在全球1000名以外的网站更有价值。终于,在“圈内人”的口口相传中,Alexa排名在中国互联网上名声大噪,而此时,远在大洋彼岸的Alexa却对它的中国Fans们一无所知。
当Alexa排名开始得到业界的普遍认可时,终于有人开始利用Alexa排名来创造“价值”了。大批个人网站的站长们开始研究Alexa的排名规则,网上开始流传各种针对Alexa的作弊工具,很多网站上开始刊登介绍Alexa作弊方法的文章,各种论坛里开始出现对Alexa排名的讨论。一时间,中国互联网业界刮起了“Alexa旋风”。
在2003年底,针对这股Alexa热,一些业内人士又开始质疑Alexa排名的可信度,并揭发出很多网站作弊的“内幕”。事实上,有相当多网民都对Alexa的排名表示过怀疑,因为在2003年的大部分时间里,Alexa排名上的全球第三和第四的网站是两个韩国网站,Alexa对此的解释是,韩国的互联网用户中安装Alexa工具条的比例较高,因此Alexa在韩国网民中得到的采样数据比较高,这就导致韩国的两家门户网站进入了全球前五名。
不过,Alexa的解释似乎越描越黑,因为Alexa工具条始终只有英文版,既没有中文版,更没有韩文版,如果要说工具条的普及率高,欧美国家应该首当其冲。有网友据此认为,韩国网站是靠作弊提升了网站排名,更有人认为,既然Alexa根本没有向亚洲国家推出本地化版本的工具条,亚洲国家就应该坚决抵制Alexa排名。
无论如何,从追捧到棒杀,业界对Alexa的关注一点儿都没减。进入2004年以来,照样有很多网站的站长们在绞尽脑汁地想把自己网站的Alexa排名“做上去”,而以前揭露过Alexa的炮手们也同样继续怀揣各种目的炮轰着Alexa.今年十一长假过后,国内网站在Alexa上的排名突然经历了一次大规模集体滑坡,各种谣言开始在网民中流传,一种比较流行的说法是,Alexa终于开始调整算法来反击越来越多的中国作弊网站,人们把这看做是Alexa的“正当防卫”,毕竟,一个以排行榜为最大卖点的网站赖以生存的就是它的排名的公正性。
各种传言都无法解决看客们对Alexa可信度的疑惑,因为国内主流媒体从未针对Alexa的技术进行过深入的分析和报道,而在下面的介绍中,读者可以看到,或许韩国网站排名过高另有原因,而所谓的Alexa作弊手段也不只是此前一些媒体报道的多次刷新那么简单,而且,Alexa也有自己非常高明的防作弊手段。不过,本文中所提及的作弊手段与网上随处可见的“作弊宝典”有本质的不同,所以,Alexa在多大程度上能抵御这种不常见的作弊方式也就很难说了。
Alexa工具条的DNA
要想彻底搞清楚Alexa排名是否可信,必须从技术上对Alexa的全球网站流量监测进行全面的解剖,当然,Alexa从来没有公布自己的技术细节,记者决定“以彼之道,还施彼身”,既然Alexa声称其数据来源就是那个工具条,记者决定首先从破解工具条入手。
受记者委托,圈内著名的Web技术专家小林,用了近一个晚上的时间,对Alexa工具条及其向Alexa返回的数据进行了细致的分析,得出了很多宝贵的第一手资料。多年前对Alexa就做过研究的小林认为,最近的这次分析揭示了一些Alexa更隐秘的技术细节。
小林告诉记者,现在最新版本的Alexa工具条的运作机理与以往没有太大的改变,每当用户以装有Alexa工具条的IE浏览器打开新页面时,Alexa的一台服务器(data.alexa.com)都会收到加密的数据包,这个数据包中的核心信息就是十几个参数,这些参数包括当前网页地址、页面打开时间、用户端显示分辨率、Alexa工具条版本号、该用户是否为“亚马逊”的用户等,其中有一个重要的隐含参数,经小林分析,认为是Alexa为每个已安装的工具条自动生成的ID号码,这个号码应该是全球惟一的。Alexa可以通过这个ID对每个反馈数据包的发出者进行惟一标识,这是解决PV重复计算问题和防止同一用户多次刷新作弊的一个重要手段。
小林告诉记者,从目前研究的结果来看,任何一个汇编高手都可以很容易地掌握Alexa工具条返回的数据包中的秘密,如果这个人同时也是一个网络编程高手,那么要针对Alexa作弊就比较容易了。从记者后来对一位上海的Alexa作弊高手的采访来看,小林的分析完全正确。该作弊者正是一位资深的Web开发工程师,其采用的手段与小林的分析也基本吻合——编写一个Alexa工具条返回码生成器,批量产生Alexa能够辨识的代码串,然后用虚拟多用户的方式发回data.alexa.com,这样就可以欺骗Alexa的服务器,让它误以为这些数据是不同用户发来的(征得该作弊者本人同意,本专题在最后公开了记者与该作弊者的网上聊天实录)。
小林认为,这种以编程方式模拟多用户访问的作弊方式的实现,最重要的环节就在于对那个Alexa用来惟一标识用户身份的ID号的生成算法的破解,这需要对足够多的Alexa工具条进行嗅探,抓取其数据包进行定量的算法分析。但小林同时也指出,这些工作对于一个编程高手来说,确实不算什么,只是最终作弊的实现仍需要模拟一个足够快的ID号生成程序,这可能会比较困难,不过据小林估计,国内能做这些事情的人不在少数,只是互联网这个圈子里的高手们很少去做罢了。
从以上的技术分析来看,Alexa的服务器每天所做的工作就是不断接收全球用户传回的数据包,提取其中的那十几个参数并写入专门的数据库,然后在某个特定时间对当天收集到的这些数据进行分析计算,并以新的计算结果去更新当日的网站排名。据记者观察,这个数据库的分析结果至少会保存三年之久,因为在Alexa网站上对每个网站的Rank排名变化趋势图最多能提供三年来的数据变化。
在破解了工具条的DNA之后,记者还与一些朋友探讨了Alexa工具条在全球的分布情况。按照Alexa的说法,工具条是它惟一的信息获取来源,那么工具条在全球用户中的分布也就成了另一个可以影响Alexa排名的重要因素。如果工具条真的是Alexa数据的惟一来源,可以想象,当中国网民都没有安装Alexa工具条的时候,新浪搜狐这样的门户网站恐怕在Alexa排名中都见不到影子,可是今年下半年以来,新浪和搜狐就已经紧随Google排在全球第四和第五的位置了,这似乎说明了Alexa工具条已经在中国具备了较高的普及率,否则,新浪、搜狐以及紧随其后的占领了Alexa全球500强中近1/3份额的中国网站就都有作弊的嫌疑。
幸好记者的一位朋友曹政提供了令人欣慰的数据。作为网站流量分析专家,曹政在www.tong123.com 上为多达2000家国内各类网站提供长期的流量监测与统计分析服务。曹政的流量分析与Alexa的不同,Alexa不在被监测的网站上做任何事,而tong123.com对网站进行页面内嵌方式的第三方流量统计。受记者委托,曹政临时在其数据采样分析器里加入了对Alexa工具条的监测。经过一周的数据统计,曹政得出的结论是:访问www.tong123.com 系统监测的2000家网站的所有用户中,Alexa工具条的安装率在1.5%左右。
就在发稿前,曹政还给记者发来了对这一结果的补充说明,他认为,由于tong123的系统采用累计平均值的计算方法,Alexa工具条的实际安装比例应该比现在得到的数据更高,因为这个监测项刚加进去不久。
由于tong123.com的监测范围是2000家各类网站,基本上排除了由于监测对象较少可能造成的用户选择倾向性,其可信度比较高。即使以1.5%这个被低估的安装率来衡量Alexa在国内用户中的影响,也已经十分惊人了,若国内互联网用户以总数9000万计算,则其中安装了Alexa工具条的用户可能已超过130万。按照Alexa声称的1000万左右的工具条全球下载总量来看,中国网民对Alexa的热衷似乎显得更为突出,这或许也可以作为国内网站今年在Alexa排行榜中整体排名提高的一个解释。
既然工具条的分布会从很大程度上影响Alexa的监测结果,那么Alexa的排行榜就可能出现很大的地域相关性,如果确实如此,Alexa的权威性就真值得怀疑了。事情远没有这么简单,在Alexa网站上,记者看到全球网站前10万名排行榜的报价是499美元,显然,在大洋彼岸,还是有人认可Alexa的排名数据,甚至会花钱去买那个排行数据。
莫须有的技术隐私
在Alexa各种公开的资料或是网友对它的讨论中,都没有人明确提出过Alexa除工具条以外是否还有其他能够获取公网流量的监测手段,而长期为多个著名网站提供技术支持的小林,通过对这些网站的日志分析,认为Alexa还有很多技术隐私。由于无法得到Alexa的官方回应,我们只好说这些可能被采用的技术手段是“莫须有”的。
为了进一步探寻Alexa的隐私,我们还要先看看Web浏览的过程。当用户打开IE浏览器,在地址栏中输入一串网址并回车后,一些包含了http请求的数据包就被发送出去,与其他流量一样,这些数据包也要经过用户所在内网的网关,被路由到公网,经过一个个电信机房,最终传送到某个提供DNS解析的服务器上,在获得目的网址的IP地址后再被放到一个可以最终路由到目的IP的路径上传送过去。从http请求的发送过程来看,如果Alexa对全球所有的DNS解析服务器进行嗅探,将有可能得到一份非常接近事实的全球http请求数据,由此就可以非常清晰地勾勒出哪些网站被哪些用户所关注。
不过,要嗅探全球的http请求,对Alexa来说几乎是天方夜谭。退一万步,即使Alexa能抓取到这些数据,它也不可能有以这些数据为基础进行计算的能力。但是,Alexa排名所显示出的一些“抖动”迹象似乎在告诉人们,除工具条之外,Alexa确实有使用其他技术手段的嫌疑。
2004年夏天,小林发现中国香港的网站排名出现异常的提升,像“太阳报”这样的小网站,居然能超过很多内地大网站的排名。由于电信网关和简繁体系统的原因,内地与香港网民一般是不做“跨地区互访的”,而香港网民安装Alexa工具条的绝对数也不会比内地用户高。从前文的分析和计算来看,内地网民中Alexa工具条的安装量恐怕比全香港网民的数量都不低,这样的情况下,香港网站在Alexa排名的普遍大幅度提升就显得毫无道理。
经过两个月的高排名期后,香港网站的排名开始逐渐回落,但至今仍有部分网站的排名高出其实际应处的名次。小林认为,这个现象与韩国网站在2003年出现的情况有很大相似性,而韩国的很多网站目前仍有偏高的排名。这种现象如果用Alexa工具条的普及率来解释是不合情理的,但如果用Alexa增加了其他采样机的说法来解释,就很容易说得通。
据小林推断,Alexa可能在全球不同地方设置了一些采样机,通过与一些电信机构进行或明或暗的合作,甚至在临近电信网关的节点进行网络嗅探,得到一些“弥补性”的采样数据。而寻求这些采样数据的目的恰恰是为了照顾Alexa所认为的“工具条低安装率”地区的抽样效果。打个比方,如果Alexa认为韩国互联网已经非常普及,而韩国用户却一直没有安装Alexa工具条的习惯,它就可能会设法在韩国安插一些采样机,以弥补在韩国用工具条采样的不足。同样的情况,也可能导致香港在刚刚设置采样机时网站排名的猛增。而经过一段时间的考察,Alexa就会逐步调整在每个地区的采样数量,以得到它所认为的最合理的结果。
甚至小林还认为,今年内地网站排名的大规模提升也有采样机在作怪,而国庆后内地网站排名的普遍下降也许就是因为Alexa在经过一年的考察后,重新调整了在中国内地采样比重的结果。
当然,Alexa要维护其排名的权威性和公正性,不仅要完善流量数据的采样过程,更要在防止作弊方面做出巨大努力,那些防作弊的技术也都是Alexa的不宣之秘。那么Alexa到底是用什么办法来防止作弊呢?事实上,对于前文中记者提到的以编程模拟Alexa工具条返回数据包的作弊方式,Alexa几乎没什么好办法去防范,甚至要探测到这样的作弊手段都比较难。
其实,对于现在网上常见的作弊手段,Alexa都已经有了足够的免疫力。一般来说,由于现在多数搜索引擎都无法处理JS脚本,所以针对搜索引擎的作弊往往都是用JS脚本编写恶意代码来实现,而Alexa和Google采用的爬行程序则是目前仅有的可识别JS脚本的此类程序。
小林在对几个大型网站的流量监测中发现,Alexa启用了一个叫做IA_Archiver的机器人程序,这个机器人程序类似Google等搜索引擎使用的蜘蛛程序,专门在互联网上爬行,刺探每个Web页面的流量信息。尤其是当某个网站的流量超过Alexa设定的阈值时,IA_Archiver就会马上爬到该网站的服务器上,分析此网站的流量是否正常,有没有作弊行为。据小林对IA_Archiver的监测,该机器人程序已经可以识别大部分基于网站服务器端的流量作弊行为。但现在业内对IA_Archiver的认知普遍不足,记者也只是在Alexa网站的一个帮助页面上看到有关IA_Archiver机器人程序的简单介绍,而国内知道这个机器人程序的人不多,更缺乏相关的技术研究。
信任Alexa?
针对Alexa排名的可信度,不同的人有不同的看法,从事Web技术研究与应用的业内人士多倾向于这样一个说法:Alexa排名不一定是绝对准确的,但却是相对可信的。下面记者举出的一些例子,将从不同方面对Alexa排名的可信度进行对比。
必须承认,尽管Alexa用很多技术手段提高了网站流量监测数据的有效性,但由于其固有的一些技术上的瑕疵,难免使少数网站的排名结果出现一些问题,尽管这些问题在很大程度上要归咎于网站域名结构的不合理性。
比如,Alexa排名是针对URL地址的,并没有考虑IP地址的因素,这在很大程度上降低了Alexa排名计算的难度,但是也不可避免地产生了偏差。一般而言,Alexa只对二级域名感兴趣,而针对三级域名的流量都被纳入了上一级域名的统计,对于比较规范的大型网站而言,这是完全正确的策略,但是对于一个向不同用户分发了三级域名的网站来说,它的流量统计是否应该将所有的子用户的流量加起来呢?这显然要因情况而异,一个很明显的此类不合理统计的例子就是cninfo.net,相信国内老网民都还记得这个域名后缀,这是全国各省市公众信息港通用的二级域名,比如,sh.cninfo.net和gd.cninfo.net分别是上海和广东的两个网站,而Alexa则将其统一算做www.cninfo.net 的子域。于是,www.cninfo.net 就成了简体中文网站排名第40多位的网站,尽管它其实根本就不是一个可以访问的网站。
对于Alexa排名可信度的另一种质疑来自不同类型网站的流量特征的巨大差异性。比如,门户网站与专业网站或专业论坛的流量就几乎没有可比性,因为不同类型的用户在不同时间不同场合访问不同类型的网站时,其浏览习惯会有极大的差异。
即使两个网站按照Alexa算法得出的综合流量评估值完全相同,那也不能把两个网站的影响力划等号。比如,一个Reach值为1000,PV值为1的网站与一个Reach值为100,PV值为10的网站的Rank应该是相同的,但大部分情况下,后者的内容会比前者更有价值。因为浏览前一个网站的用户都是只看了一个页面就走掉了,说明该网站可能没什么吸引力;而后一个网站的用户平均要看十个页面才会离开,这些用户都很认可该网站的内容。当然,更极端的情况也会出现,比如前者只有一个页面,但该页面内容非常丰富,而后者的每个页面内容都很少,或是给用户设置了很多不必要的跳转,甚至后者也可能就是一个小说连载站。
这些复杂情况的存在让人很难相信Alexa可以只用Reach和PV这两个值就把所有互联网上的站点划分出三六九等。不过,如果我们换一个角度来看Alexa,就会发现它的存在也是有理由的,甚至也可能是确实值得网民信赖的。
如果我们只把Alexa当做一个流量分析服务工具,它的价值就凸现出来了。Alexa网站上提供了非常直观的流量变化趋势统计图功能,这在其他很多情况下是要付费才能获得的服务,而Alexa只是将其作为免费的公众服务。
图1是Alexa上提供的计世网(ccw.com.cn)一年来的流量排名(Rank)走势图,从图上可以清晰地看出,该网站2003年11月3日~2004年11月3日的排名从7500名左右上升到2000名以内,而其中三次非常突然的下降曲线所对应的日期分别是春节、五一、十一这三次长假。众所周知,计世网的用户主要集中在IT行业中,这三次长假导致的下降曲线非常忠实地记录下当时的网民浏览情况——因为放假,大多数用户去旅游或在家休息,上网用户大大减少,所以流量降低,网站的排名也随之降低。而长假过后,IT人回到单位,头一天上班总会想到网上去看看业界的最新资讯。所以长假之后,ccw.com.cn的流量反而都比放假前有不同程度的提升,反映在Rank曲线上,就是三个大的波谷之后曲线高度的恢复与持续攀升。
事实上,如果能够详细分析网站流量变化的趋势,人们也可以分辨出那些作弊的网站,因为作弊网站流量的变化往往是非正常的,其与正常网站的流量变化曲线肯定有不同之处。图2和图3分别是265.com和dsdiy.com的半年来的流量排名趋势变化图,265.com是国内著名的网址导航站,最近半年的全球排名一直稳定在70~120名以内。反观dsdiy.com的Rank变化曲线就颇值得怀疑,9月的第一周,该网站的排名就从全球10万名之外一跃至200名左右,其后的一个月内,该网站的排名一直在100~400名之间徘徊,而就在国庆长假的第一天,该网站的排名竟然蹿升至30名左右,到了10月的第二周,该网站的排名又迅速回落至10万名开外,在Rank曲线图上再也看不到了,拥有类似排名曲线的网站还有sinapet.com和haohz.com等等。
作为Web访问情况的监测工具,Alexa在记录了网站的真实访问量的同时,也同样记录了那些作弊网站的流量变化情况。从这个意义上说,Alexa显然也是可信的,关键是我们选择的视角必须能恰到好处地发挥Alexa的作用。
无论出于什么样的目的,人们出卖Alexa总是希望能从中得到利益,对Alexa的研究越深入,对Alexa的价值理解得越深刻,就越能从中获益。
附文:
点对点采访:Alexa排名高手
通过MSN Messager,《计算机世界》记者王翌(cciewang@msn.com )在线采访了国内一位顶尖的Alexa网站排名高手(alexa_improve@hotmail.com ),经对方同意,特刊出双方在网上的对话实录(A=alexa_improve@hotmail.com ):
作弊业务收入高 百强排名值万金
王翌:听说你能做Alexa排名?可以做到100名左右?
A:当然,更高也可以,100名左右的话,每月要两万块甚至更多。
王翌:你知道的像你这样的同行,国内有多少家?
A:我知道的就只有两家,都是重庆人做的。
王翌:你搞Alexa排名是专职还是副业?
A:当然是副业。但现在做这个业务赚得比我工资高多了。
王翌:你们现在是几个人做?
A:核心是我一个,还有几个朋友帮忙,我们从2002年就会这个了。
王翌:你有没有试过,能做到的最好成绩是怎么样的?
A:现在我可以把一个没流量的网站维持在大概50名左右,这是极限。不过一般我们不会乱来。而且也没有人出那么高的价来雇我们做那么高,我们是根据排名高低来收费的。
王翌:维护这些网站的排名是不是会越来越容易?因为把他们做上去以后,流量真的能增加?
A:客户一般都是广告和我们一起做。
王翌:你的意思是他们在拉高排名的同时,也做网站推广?还是说他们自己拿排名去拉广告?
A:是前者,做网站的人都知道,光有一个假的排名没意思。客户的心态其实很简单,他们做了广告,真实人气会上去,但不一定排名会上去。
王翌:所以,Alexa只是提升品牌的另一种方式?
A:他们大笔钱花在广告上,少笔钱花在我们身上,这样两头并进,等流量真的上来一些,排名也做上去了,他们再去接广告就容易了。广告商一看,排名不错,就投上来试试,这样他们自己的流量又确实不会太难看,广告商更容易认可。
编程破解工具条 排名多少全可控
王翌:Alexa工具条的工作机理你应该很清楚了吧?我昨天在一个朋友那里看了破解的代码,它是每次在用户浏览时都返回一串代码,这些代码中大概有9~10个参数,包括网址、浏览方式什么的,甚至网速都能监测到了。你了解的情况是这样吗?
A:差不多就是这样,但那个不是网速,是加载页面的时间。比如同样一个页面,你在本地访问,就是very fast,你在国外访问,就是slow,所以我觉得Alexa给出的Speed这一项是不公平的。
王翌:能具体谈谈你们采用的方法么?据我所知,Alexa排名的两个基本参数,也就是Reach和PV,针对它们都是可以作弊的,但实现的方式不同,另外Alexa也有一些防作弊的手段,你们是怎么搞定的?
A:写程序。
王翌:破解Alexa工具条?
A:对,我们的机器上都不装Alexa工具条,这玩意儿又慢又内存泄漏,烦死了。我们是在FreeBSD下用C语言写的模拟器,可以同时影响Reach和PV两个值。
王翌:这个模拟器是不是就在一台机器上模拟多人同时在线去访问网站?
A:可以这么说。破解了它的算法,就可以模拟成很多人了。
王翌:你们做的一台机器能模拟成多少人访问?如果要把一个网站从无到有的做到100名,需要动用多少资源?多少时间?
A:恕不奉告,反正就是模拟多人访问。
王翌:你有没有拿网站做一些试验?
A:肯定要做试验啊,比如dsdiy.com就是我做过的一个,你可以看看Alexa上这个网站的Rank图。那个站长同意我拿它来给客户做演示的,否则我也不会告诉你,我们这行也要讲信誉的,不能随便透露客户信息,我也只能告诉你这一个。
王翌:这种虚拟多用户访问的方式是不是很占内存啊?
A:还好,主要是耗费CPU的资源,不过FreeBSD够强劲,要是在Windows下可就累了。
王翌:是不是主要靠CPU计算出大量的伪装Alexa返回代码,然后只要有足够带宽给送回去就可以了?
A:对,但带宽不是问题,至少在我这儿还没成为过问题,说白了最重要的还是模拟器的算法实现。
王翌:我从朋友那里看到的好像每个代码串也就百十来个字节吧?
A:对啊,所以说带宽不是问题。CPU其实一般的也就行了,别太差,以线程方式跑。有两三家客户直接找我谈过买下技术的事情,不过价格太低我没同意,他们也太小看这技术和它的含金量了。
王翌:你既然跟踪了Alexa两年,工具条返回的这串代码的算法规则,Alexa有过变动么?
A:只有过很小的变动。
王翌:今年10月份是不是有过一次变动?好像国内网站普遍受到波及了。
A:它修改了两个参数的权重,增加了PageView的权重。所以那些纯粹靠打广告来拉流量,但本身又留不住用户的网站就吃亏了,这样的网站虽然流量可能有提高,但是PageView不高,被广告吸引过来的用户看一眼感觉没意思,可能马上就跳转到别的网站了。
王翌:那么你知道Alexa排名的完整的算法公式么?
A:具体怎么算,只有Alexa知道,但是它肯定希望这个算法是合理的,所以它也会根据一些常见的作弊手段来调整它的算法,但是我们用的这种办法是直接破解工具条,除非它放弃现在的工具条技术,否则还是拿我们没办法。
王翌:除了工具条,Alexa排名还有没有其他的依据?
A:现在人们知道的就是工具条,Alexa好像也没说过还有别的办法,所以只能是抽样数据。经常有人说,我们的网站独立IP上升了那么多,为什么排名反而下跌啊?我就告诉他们,有两个原因:1、独立IP多并不代表装了Alexa工具条的访问用户增多了;2、就算你的多了,别人的说不定更多了,排名是互相比较出来的。
作弊也有原则性 吃水不能忘掘井
王翌:你们现在接了多少客户?
A:我们一般不会乱做的,现在还在做的也不超过5个,很谨慎的,但是找我们的人始终非常多。
王翌:都是要求做到100名左右?
A:也不是,也有只要求到2000多名的,这样的客户很理智。
王翌:选择这些客户的原则是什么?是有钱就行么?
A:不是,有些小网站,一来就要我们给它做到100名,这种我们不接。
王翌:要求太高的你们不接?
A:不是要求太高,我要想做也可以做到,但说句实话,我们是Alexa的寄生虫,也不愿意一下把自己的“宿主”给搞死了。
王翌:也要讲策略?
A:是的,上次有个客户就被我气坏了。呵呵,一个MM,我当时一下说得太直了,说垃圾网站要那么高排名干嘛,她就生气了。
王翌:是不是可以这样说,网上现在有5个网站的Alexa排名是你们在维护着,并且都在100名以下?
A:是,出得起100名价格的网站很少,基本上我做的就是300~1000名左右。
王翌:300名的价格是多少?
A:每月8000块。如果说标的是300名,那其实就是300~400名浮动,王翌:这个价格对于一些小网站也就不低了。
A:小网站凭什么到全球300名?
王翌:找你的全都是大网站?
A:至少是有资格的吧。有些小网站只要求到1万名左右,这种业务我们又懒得接,不值得做。
王翌:你对他们的要求是什么呢?
A:就是至少这网站还像个样子,而且出得起这钱。也有个客户只做了一个月,因为服务器被黑客攻击了一阵,排名跌得很惨,就找我来帮他们做一个月,把损失挽救回来。
王翌:但是你们一个月后不做了,它岂不是又掉回去很多?
A:不,那个网站因为还是有很好的用户基础,流量也一直在慢慢回升。他们只是需要我把他们损失的季度平均排名挽救回来。所以我每天都需要给他们改力度,用渐变的方式,这样别人也不容易看出来是有人在帮他们作弊。
王翌:你们的方式可以想怎么上去就怎么上去,甚至能控制节奏,是么?
A:是的,以前不能,后来改进了,因为客户的要求也在不断提高嘛。
王翌:是不是这样,那个月的开始你起的作用比较大,以后逐渐减少你的作用,而那个网站自身恢复的流量开始逐渐起作用,到了月底,即使你不做,他们网站自身的流量也基本恢复得差不多了?
A:对,这样的话,那个网站在Alexa上的Rank曲线在这个月就比较平缓,不知情的人根本看不出来,只能看出他们被攻击的那几天排名骤降,然后就马上恢复了,其实那个恢复的过程长达一个月。我的作用就是让那个网站的季度总平均排名不受影响。这种有实力的网站,我就是不做,一个月后还是能恢复过来的,只是由于这一个月的排名都比较低,会导致连续三个月的季度总平均排名不好看。
王翌:这种有实力的网站也很在乎Alexa排名么?
A:非常在乎啊。
王翌:为什么?
A:我举个例子,你办个网站,跟广告商说,我的网站花好稻好,人家去Alexa上一查,原来你的网站排名那么低,谁还信你啊?
王翌:不过Alexa的工具条在国内用户里装的确实不多啊,这样对国内网站似乎很不利吧。
A:现在已经多起来了,信不信由你。我在2002年就掌握这技术了,但也是今年才开始开展这种业务的,因为Alexa是近期才开始在国内受到重视。
王翌:你所知道的国内网站作弊的多么?
A:找我的人很多,国内很多网站都在干这种事,但作弊的手法都不高,懂这个的人从Alexa的历史曲线图中都能分析出来。
ps: 网联推广大师
是国内领先的互联网优化推广产品,可一起完成对google推广、baidu推广、yahoo推广、alexa排名的专业服务平台。