- 博客(2)
- 收藏
- 关注
原创 突破反爬虫
突破反爬虫的核心思想: 将爬虫模拟的像人在操作一样1. 验证码: 1. 识别验证码 2. selenium突破滑动验证码 3. 人工打码 4. 打码兔 2. headers头: 1.改U-A头和referer3. 检测ip访问频率 1. 更换ip4. 检测ip访问间隔 1. 设置随机访问频率5. 同一账号高频率访问 1. 注册多个账号,造cookie池,随机cookie访问...
2018-07-30 16:22:18 272
原创 解析json踩过的坑 元组转字典
json如上图,获取json后,发现是元组,使用veal()转换,一直报错,请教群内大神后,发现是不规则的json,解决方法如下# -*- coding: utf-8 -*-import requestsimport jsondef url_get(url): response = requests.get(url, headers=headers) response =...
2018-07-03 17:53:15 1003
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人