网络爬虫之寻找登陆的post地址

寻找登陆的post地址
  • 在from表单中寻找action对应的url地址
    – post的数据是input标签中name的值作为键,真正的用户名作为值的字典,post的url地址就是action对应的url地址
  • 抓包,寻找登陆的url地址
    –勾选perserve log按钮,防止页面跳转找不到url
    –寻找post数据,确定参数
    参数会变,参数则在当前响应中,通过js生成
    不会变,直接用,比如密码不是动态加密的时候
定位想要的js
  • 选择会触发js时间按钮,点击event listener,找到js的位置
  • 通过Chrome中的search all file来搜索url中的关键字
  • 添加断电的方式来查看js的操作,通过Python来进行同样的操作

requests小技巧

  • r = requests.get(url)
    requests.dict_from_cookiejar(r.cookies) 将cookie转化成字典
    requests.cookiejar_from_dict() 将字典转化为cookie
  • 请求SSL证书验证
    r = requests.get(url,verfiy=True)
  • 设置超时
    r = requests.get(url,timeout=10)
  • 配合状态码判断是否请求成功
    assert r.status_code==200
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值