网上随便找到一个网站,原网站,Onon翻译,输入字符限制4000,
爬虫过程
- 原网站右键点击检查
- 点击网络
- 可以看到唯一的一个包就是我们需要的
- 将请求表单的请求头和请求数据封装一下就可以了
代码
# coding:utf-8
import requests
import re
dr = re.compile(r'<[^>]+>',re.S) # 替换文本中的re标签,只保留值
网上随便找到一个网站,原网站,Onon翻译,输入字符限制4000,
# coding:utf-8
import requests
import re
dr = re.compile(r'<[^>]+>',re.S) # 替换文本中的re标签,只保留值