如何编写一个自动投票程序

*********************************************************************************** 
*                  版权声明                         
*         此文章为ocean所有,版权归ocean所有,任何网站 
*和 媒体转载必须包含此段声明,否则将视为侵权,作者将  
* 保留一切权力。此声明为此文章中不可或缺的一部分。  
* 作者网名:ocean                                   
* 作者email:                    
* 作者网站: http://www.oceanstudio.net              
*                      http://sps.oceanstudio.net              
* 作者blog:博客园, http://www.cnblogs.com/ocean    
* 此文章发表时间:2005年2月1日                      
* 此文章源:  http://www.cnblogs.com/ocean/archive/2005/02/01/100445.html 
************************************************************************************ 
我经常去网站抓些东西,有时也做一些自动填写表单的事情。最近接手了一个投票的任务,也即需要编写一个程序自动投票,从而也引发了如何编写自动投票程序和如何编写投票程序(投票程序怎么样防止自动投票)的话题。正所谓道高一尺、魔高一丈。自动投票和投票程序本身就是一种对弈状态。 
如何编写投票程序,大致分为这么几步:

1:手动投票,分析中间出现的每一个页面的代码,找出投票规律。

2:捕获提交页面的时候所post的信息。

3:编程模拟这个手动过程。

我以我刚写的这个自动投票程序为例。在此我不会给出网址链接(保密),也不会给出真实数据和截图。

首先手动投票,是一个多选投票,点击投票按钮后,会弹出一个网页,这个网页会问你是确认还是放弃,点击确认后,返回投票成功的提示。当在此点击投票按钮的时候提示已经投过一票,不能重复投票。关闭所有浏览器窗口,打开一个新窗口,投票,仍然可以投票成功。根据如下行为,可以得出如下结论:

1:投票需要有两次和服务器的交互,第一次向服务器提交投票结果,第二次交互向服务器提交是否确认此结果。

2:此两页面之间的session是有联系的,也即同一个session下不能投两次票。当关闭浏览器,重新开启刘拉尼后,因为相当于新开了一个session,所以仍然会投票成功。

知道了这个后,就开始抓去两次交互的HTTP头信息(Header信息)

第一次交互的信息如下(点击投票按钮): 
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, application/x-shockwave-flash, */*  
Referer: http://xxxxx/xxxxxxxxxxxxxxxxxxxxxxxx  
Accept-Language: zh-cn  
Content-Type: application/x-www-form-urlencoded  
Accept-Encoding: gzip, deflate  
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; MyIE2; .NET CLR 1.1.4322)  
Host: xxx.xxx.xxx.xxx  
Content-Length: 167  
Connection: Keep-Alive  
Cache-Control: no-cache  

checkvalue=32
&bbb =%CD%B6%C6%B1 &ilc =0 &kkk =22
 

从网页源代码中可以分析出来,数据是post上去的,post的数据为"checkvalue=32&bbb=%CD%B6%C6%B1&ilc=0&kkk=22",其中checkvalue=32即为投票选中的复选框的值,bbb为投票按钮的名称,"%CD%B6%C6%B1"为"投票"两个汉字的转码。ilc=0和kkk=22是两个隐藏域中信息,作用还不明确。

从网页源代码中可以分析出来,数据是post上去的,post的数据为"checkvalue=32&bbb=%CD%B6%C6%B1&ilc=0&kkk=22",其中checkvalue=32即为投票选中的复选框的值,bbb为投票按钮的名称,"%CD%B6%C6%B1"为"投票"两个汉字的转码。ilc=0和kkk=22是两个隐藏域中信息,作用还不明确。 
然后接收到的Header如下:
Date: Wed, 05 Jan 2005 12:45:10 GMT  
Server: Apache/1.3.27 (Win32)  
X-Powered-By: PHP/4.1.2  
Set-Cookie: ilc=22  
Keep-Alive: timeout=15, max=100  
Connection: Keep-Alive  
Transfer-Encoding: chunked  
Content-Type: text/html

 
可以看到里面有一个关键的地方Set-Cookie : ilc = 22,也即设置了一个cookie,这个cookie值为22,也即post上去的kkk的值,猜测这是此次投票的编码。

可以看到里面有一个关键的地方Set-Cookie : ilc = 22,也即设置了一个cookie,这个cookie值为22,也即post上去的kkk的值,猜测这是此次投票的编码。 
从返回的源代码中可以分析出来checkvalue=32这个值并没有写在第二个页面的隐藏域中,那么它就只能记录在session中。从第二次交互的信息中也可以证明。

第二次交互的信息:

发送:
 
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, application/x-shockwave-flash, */*  
Referer: http://xxxxx/xxxxxxxxxxxxxxxxxxxxxxxx  
Accept-Language: zh-cn  
Content-Type: application/x-www-form-urlencoded  
Accept-Encoding: gzip, deflate  
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; MyIE2; .NET CLR 1.1.4322)  
Host: xxx.xxx.xxx.xxx  
Content-Length: 22  
Connection: Keep-Alive  
Cache-Control: no-cache  
Cookie: ilc=22  

inbtn=%C8%B7%C8%CF

可以看到第二次post上去的信息仅仅是一个按钮的信息。inbtn为"确认"按钮的名字。而"%C8%B7%C8%CF"就是"确认"两个字的转码。checkvalue=32这个投票信息并不包含在第二次交互中,这只能说明第一次交互中就把这个信息写入到session中保存了。

可以看到第二次post上去的信息仅仅是一个按钮的信息。inbtn为"确认"按钮的名字。而"%C8%B7%C8%CF"就是"确认"两个字的转码。checkvalue=32这个投票信息并不包含在第二次交互中,这只能说明第一次交互中就把这个信息写入到session中保存了。 
不能重复投票可能是session中有记录,也可能是cookie中有记录。cookie的可能性大一些。 
那么怎么模拟这个过程呢,我用了WebClient类,这个类非常好。其中的Headers属性可以设置头信息。而UploadData函数则可以post数据上去。并且同一个WebClient的两次连接是在同一个Session中的。这样完成两次交互也就是一次投票之后,就可以重新new一个WebClient,这样就相当于重新开了一个Session。 
代码如下:
static   void  post()
{
    
string  uriString  =   " http://xxxxx/xxxxxxxxxxxxxxxxxxxxxxxx " ;
    WebClient myWebClient 
=   new  WebClient();
    
string  postData  =   null ;
    
byte [] byteArray;
    
byte [] responseArray;
    WebHeaderCollection myWebHeaderCollection;

    postData 
=   " checkvalue=32&bbb=%CD%B6%C6%B1&ilc=0&kkk=22 " ;
    myWebClient.Headers.Add(
" Content-Type " " application/x-www-form-urlencoded " );
    myWebClient.Headers.Add(
" Referer " " http://xxxxx/xxxxxxxxxxxxxxxxxxxxxxxx " );
    myWebClient.Headers.Add(
" Accept-Language " " zh-cn " );
    myWebHeaderCollection 
=  myWebClient.Headers;

    
// 第一次交互  
    Console.WriteLine( " 发送的HTTP头信息 " );
    
for  ( int  i  =   0 ; i  <  myWebHeaderCollection.Count; i ++ )
    {
        Console.WriteLine(myWebHeaderCollection.GetKey(i) 
+   "  :  "   +  myWebHeaderCollection.Get(i));
    }

    byteArray 
=  Encoding.Default.GetBytes(postData);
    responseArray 
=  myWebClient.UploadData(uriString,  " POST " , byteArray);

    Console.WriteLine(
" 接收的HTTP头信息 " );
    myWebHeaderCollection 
=  myWebClient.ResponseHeaders;
    
for  ( int  i  =   0 ; i  <  myWebHeaderCollection.Count; i ++ )
    {
        Console.WriteLine(myWebHeaderCollection.GetKey(i) 
+   "  :  "   +  myWebHeaderCollection.Get(i));
    }
    Console.WriteLine(
" 接收的正文信息 " );
    Console.WriteLine(Encoding.Default.GetString(responseArray));
    
// Console.ReadLine();  

    
// 第二次交互(用同一个WebClient实例)  
    postData  =   " inputinfo=%C8%B7%C8%CF " ;
    myWebClient.Headers.Add(
" Content-Type " " application/x-www-form-urlencoded " );
    myWebClient.Headers.Add(
" Referer " " http://xxxxx/xxxxxxxxxxxxxxxxxxxxxxxx " );
    myWebClient.Headers.Add(
" Accept-Language " " zh-cn " );
    myWebClient.Headers.Add(
" Cookie " " ilc=126 " );
    myWebHeaderCollection 
=  myWebClient.Headers;

    Console.WriteLine(
" 发送的HTTP头信息 " );
    
for  ( int  i  =   0 ; i  <  myWebHeaderCollection.Count; i ++ )
    {
        Console.WriteLine(myWebHeaderCollection.GetKey(i) 
+   "  :  "   +  myWebHeaderCollection.Get(i));
    }

    byteArray 
=  Encoding.Default.GetBytes(postData);
    responseArray 
=  myWebClient.UploadData(uriString,  " POST " , byteArray);

    Console.WriteLine(
" 接收的HTTP头信息 " );
    myWebHeaderCollection 
=  myWebClient.ResponseHeaders;
    
for  ( int  i  =   0 ; i  <  myWebHeaderCollection.Count; i ++ )
    {
        Console.WriteLine(myWebHeaderCollection.GetKey(i) 
+   "  :  "   +  myWebHeaderCollection.Get(i));
    }

    Console.WriteLine(
" 接收的正文信息 " );
    Console.WriteLine(Encoding.Default.GetString(responseArray));
    
// Console.ReadLine();  
}
运行后输出的信息和手动投票时截获的信息基本一致。 

然后就可以运行一个无限循环
int  i  =   0 ; while  ( true ){     try     {        post();        i ++ ;
        Console.WriteLine(
" 这是您投的第 "   +  i  +   " 张票 " );    }     catch  (Exception e)    {
        Console.WriteLine(
" 有错误发生: "   +  e.Message);    }
    Console.WriteLine(
" --------------------------------- " );}

我做的命令行程序,要捕捉错误避免程序停止。停止程序的时候直接X掉窗口即可。另外用命令行程序的一个好处是不用做多线程,直接多运行几个exe的实例就可以达到多线程的目的(实际是多进程了)。 

那么我们在做投票(包括其它表单)如何防备别人自动投票或者自动填写表但呢?session限制的方法显然不是一个有效的方法。而ip限制不实际,因为很多用户都没有ip地址,都是网络运营商作的NAT映射,封掉一个ip地址相当于封掉一批机器。所以一般也不采用。那么如何最有效呢。可以采用两种方法:

1:验证码,验证码直接导致了无法用程序来填写表单,因为验证码都为图片,文字的验证码是没有任何意义的。图片的验证码就决定了,如果要自动,那么必须识别出来验证码的数字和字母。至少一般人是没法做的,这是模式识别的问题。当然我也有朋友专门做模式识别的,可以从复杂背景下辨别出来潦草的手写笔迹,碰上这样的人谁也没办法了。但是像微软有些表单的验证码的图片作的非常复杂。除了背景有很多底纹之外,数字和图片还是花体的,并且角度也不一样,有竖的,有斜的,这样就很难识别。采用了验证码基本可以保证不会被自动投票。

2:ip限时间或票数:限制ip在一段时间内的投票数量或者投两票之间的间隔时间。比如同一ip地址一天内投票数不能超过100张。或者两次投票间隔至少5分钟等。这样即使有自动投票程序,其速度也就大大降低。起不到快速投票的作用。

如果同时结合这两种手段,那么基本很难再做自动投票的事情了。

另外就是上面我所提供的头信息是怎么抓取的,这个在IE上有个插件叫做ieHTTPHeader,您可以从此处 
http://www.oceanstudio.net/oceanstudy/download/ieHTTPHeadersSetup.rar 
可以方便的看到提交网页时所提交的头信息和post数据。
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值