Python学习之旅
Python核心编程爬虫篇2021.02.19
指导教师:逻辑教育讲师Jerry
requests模块使用
一、安装
- 需要先安装第三方库,常用
cmd
命令pip install requests
,也可在编辑器pycharm
中安装。
二、requests常用方法
requests.get('url')
打开所爬取网址,并获取响应- 响应对象
response
的方法response.content
:直接抓取网站数据,返回字节数据,没进行编码和其它数据处理response.text
:将字节数据解码成字符串(requests
会自动选择解码方式,因此在使用response.text
查看响应结果时会出现乱码)response.content.decode('utf-8')
:手动进行解码(或response.encoding = 'utf-8'
)response.url
:返回爬取网站url
三、发送post请求
post
和get
的区别在于:get
用来获取数据,post
用来提交数据;get
参数显示在请求地址中,post
参数隐藏在FormData
中
"""有道翻译
需要加date,所需在form data中
快速生成字典:
1.选中要转换的代码,ctrl+r,选中regex
2.源匹配为 (.*): (.*)$
3.替换匹配为 "$1": "$2",点击replace或replace all
"""
import requests
import json
translate = input('请输入您要翻译的内容:')
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400'
}
data = {
"i": translate,
"from": "AUTO",
"to": "AUTO",
"smartresult": "dict",
"client": "fanyideskweb",
"salt": "16148427191403",
"sign": "8c68493fa2b13aeb859796d2299addb3",
"lts": "1614842719140",
"bv": "4a59f9fd3103a414dbd2b3d1b