php简单爬虫使用登录账号密码爬取列表
关于思路
1.定义一个变量$data用来存放你想爬取网站的登录账号和密码以及是否‘记住密码’,此篇我以博客园为例
$data='input1=Dco4FpN99He1KN+m+GNujkxG29ZJ1k8HqTCJVPnR3l8H8PdkPCTcjgbajphjoBJPiS3XiPYYcNJ9GuS9eyrEmLRHo8okmJYYkyoYbxzZoqatiUX2zkeqYrm0VNXXflqsIZddEPLNKVkEZ/l59nkfi8io4AxltPKEDPLSffUJWho=&input2=VkCACmIgvQy7oZ9UvcSDD9nmG9H9MAqBN/zIxN9f+kFcr4O6KEkMC5ZU1xWdvDSLjfKCxIM3nSf35bFklVLjaTIEU9YHfvavnGx4uewG1/Dr164OyDzfqwbyuYrbwveBRKCfh/eKmRMFy+v2NxuLPZu/u+6gOGwrhENC1urfGpc=&remember=true' ;
2.怎么知道表单要提交的信息?抓包!我用的是chrome的开发者工具
在里面可以看到表单提交的信息,remember为是否记住密码
3.开始爬虫的初始化,等一系列操作,其实最关键的是对cookie的一些设置,不过