API和DIL
库文件名=dll的文件目录 相对路径
DLL命令名是展示给自己看的
采集数据
正则表达式手册
httpwatch手册
多线程爬虫
一、爬取网页,写正则表达式
二、根据正则表达式写代码
鱼刺多线程
写注册机或者登录三部曲
一、抓一个完整的包
网页用httpwatch,手机用fidder
二、分析数据,找到数据提交的关键位置(post或者get)
post date里存放着注册的数据(用户名,密码等)(加密或者乱码)
真正提交在stream里
cookies来源,优先看server
协议头
要采集验证码
可以伪装ip
三、分析提交数据成分和cookie和协议头(headers)
四、找到相关的数据(js加密,解密)
五、用代码提交
cookie详解
200成功,302重定向(跳转其他链接,找location,可以禁止),404未找到
js基础