perl网络爬虫--举例(登录论坛eetop)

登录eetop论坛(http://bbs.eetop.cn/?fromuid=511311)的perl脚本实现。

步骤一:firefox里的firebug插件,获取post所需要的网址、参数信息。

抓包使用说明 - zhaoyangjian724的专栏 - 博客频道 - CSDN.NET
http://blog.csdn.net/zhaoyangjian724/article/details/46906833
手动登录eetop,利用firebug抓取post的网址和参数信息。
post的网址:
这里写图片描述
post的参数信息:
这里写图片描述

步骤二:perl脚本实现post过程。

#!/usr/bin/perl

use strict;
use warnings;

push(@INC,"d/tools/perl/perl-study/perl5");
use LWP;
print "this is libwww-perl-$LWP::VERSION\n";

my $browser = LWP::UserAgent->new;
my $url = "http://bbs.eetop.cn/logging.php?action=login&loginsubmit=yes&inajax=1";
require HTTP::Cookies;
$browser->cookie_jar(HTTP::Cookies->new(file => ".cookies.txt"));
my $response = $browser->post($url,
                              ["loginfield"=>"username",
                               "questionid"=>"0",
                               "username"=>"xxxxx",
                               "password"=>"xxxxx",
                               "formhash"=>"59bda889",
                               "referer"=>"",
                               "answer"=>"",
                               "cookietime"=>"2592000"
                              ]);
print $response->content;

步骤三:抓取所有论坛所有网页的用户ID信息。有了用户ID和密码字典,然后利用perl登录论坛脚本,就可以轻松当“黑客”了。所以,密码一定要设置复杂,否则很容易被“黑客”利用。【声明:纯属研究,概不负责。】

HTML::LinkExtractor - search.cpan.org
http://search.cpan.org/~podmaster/HTML-LinkExtractor-0.13/LinkExtractor.pm
Perl Spider 运行说明 For Windows - 豆丁网
http://www.docin.com/p-1097186590.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值