java爬虫的坑

-登录页面所有的空都要填上属性,登录页面所有的空都要填上属性,登录页面所有的空都要填上属性。

比如用户名,密码,是否记住密码三个需要填写的,若不将“是否记住密码”这个弄成false或者true,我的程序显示status500,找了一下午都没找到原因。微笑微笑中透露着妈卖批。

-要获取数据不一定非得用parser等函数去解析网页本身,用response类型返回的结果,会有意想不到的效果。jsoup固然强大,类似jquery选择器的select固然可以反复选择直到选到想要的元素,但是,麻烦麻烦麻烦啊!

--------------------------------------------更新线------------------------------------------------

-post密码的时候要注意是否经过js加密处理,若已经加密处理,去想获得的页面F12下面查看form-data下传过来的正确的密码。

-form-data的内容一定要带全,否则就会出错,错误可能为status500.jsoup可以直接.data("key","value")。

-json格式储存在mysql中要用转义字符,可以弄一个函数来特殊处理json串

-code200只能说明服务器正确处理了你的请求,并不一定就是你预想的结果。

-GET和POST方法选错会导致错误status500,比如正确请求是POST,你却在浏览器中直接输入了URL(用抓包工具分析,确实是GET),就会返回status500.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值