爬虫的一些内容

爬虫的一些内容

学习的哔哩哔哩上路飞学诚IT老师的视频
视频链接

1:一个反爬虫
当请求的内容返回:***你的访问出错了,用户您好,我们的系统检测到您网络中存在异常访问请求。此验证码用于确认这些请求是您的正常行为而不是自动程序发出的,需要您协助验证。***

这时需要加入header{“User-Agent”:"…"}

2:重新封装参数
当我们复制的url网页链接中有参数,处理的方法是:将链接中问号之后的删除包括问号, 再重新封装参数,该参数在查询字符串参数中在这里插入图片描述
param={
“type”: “24”,
“interval_id”: “100:90”,
“action”:"",
#一般该网页往下拉更新start就会变数据,例如0-20-40-60
“start”: 0,
“limit”: 20
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值