防shua文摘

最新推荐文章于 2020-06-02 21:29:48 发布

weixin_30834783

最新推荐文章于 2020-06-02 21:29:48 发布

阅读量59

点赞数

文章标签：人工智能 php

原文链接：http://www.cnblogs.com/janealer/p/4514393.html

版权

最近应朋友之约测试他做的投票网站防刷票机制能力如何，下面有一些心得和体会。

朋友网站用PHP写的，走的是HttpRequest，他一开始认为IP认证应该就差不多了。但说实话这种很low，手动更换代理服务器手动刷都可以。但程序员的手就是程序，于是，

首先先百度到一些免费代理服务器，非常多网站分享这些。按一定格式来储存到TXT文件。

第二步使用Fiddler来进行截取消息，拿到其http request header和body：

第三步使用.NET HTTPREQUEST。逻辑是遍历代理txt里代理，伪造 fiddler监听到的request 消息（当然其中一些cookie和其他的细节需要改变根据不同情况讨论）

_contentsList = File.ReadAllLines(@"C:Proxy.txt");
           var contents = _contentsList.ToList();
     
           var proxy = string.Empty;
           var port = 0;
     
           foreach (var item in contents)
           {
               new Thread(() =>
               {
                   try
                   {
                       // 获取代理
                       var list = item.Split(':');
                       proxy = list[0];
                       port = Convert.ToInt32(list[1]);
     
                       // 伪造消息
                       var request =
                           (HttpWebRequest)
                               WebRequest.Create(
                                   @"http://XXX.COM");
                       request.Proxy = new WebProxy(proxy, port);
                       request.UserAgent = @"Mozilla/5.0 (Windows NT 6.3; WOW64; rv:28.0) Gecko/20100101 Firefox/28.0";
                       request.Referer = @"http://XXX.COM";
                       request.Method = "GET";
                       request.Host = @"XXX.COM";
                       request.Accept = @"*/*";
     
                       request.Headers.Add(@"Accept-Language", @"zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3");
                       request.Headers.Add(@"Accept-Encoding", @"gzip, deflate");
                       request.Headers.Add(@"X-Requested-With", @"XMLHttpRequest");
                       var response = request.GetResponse();
                       Console.WriteLine(response.ToString());
                   }
                   catch (Exception e)
                   {
                       Console.WriteLine(e.Message);
                   }
               }
               ).Start();

然后我朋友发现这样的确问题很大，于是他采用了验证码验证模式，即首先服务器会发给你验证码，你发的request的uri里参数必须要包含相同的验证码。

这种方式非常好，至少干掉了绝大多数的刷票软件。但我仍然想试验一下，这有一种battle的味道。哈哈

其实这个逻辑来说就是一来一回。给我验证码图片，我识别出来，然后再发送就好了。难度就在于验证码的OCR。

一开始我朋友验证码非常简单，就是几个数字，于是我直接使用最基础的OCR识别就干掉了。

后来他加了噪点，OK，这个也没有问题。我们降噪，然后再识别，虽然机器学习需要一段时间，但正确率还是有一些的。

最后他采用了随机产生汉字，我发现，汉字的OCR是个很麻烦的事情。这也是我下一步要研究的点，以后会出一篇关于OCR的文章。

随后他说还会加入一些cookie验证什么的，到这里我觉得我朋友的网站现在算是挺完善了。然后我就问下我老大，如果是他，他会怎么来刷票。

我老大回复非常简单，租人人工刷，随你技术怎样，我给他们两毛一票，你算算时间成本，完全划得来。

虽然这可能就是他随口一说，但我有一些感悟。

转载于:https://www.cnblogs.com/janealer/p/4514393.html