Requests 库的基本使用
使用get方法发送请求 ( 若网页为post请求,则将get改为post即可 )
1、导入requests包
import requests
#有时候还需要传递data参数
例如:data = {
“first”: “true”,
“pn”: 1,
“kd”: “python”
}
2、构造请求头
headers = {
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36",
"Referer":"https://baike.baidu.com/item/%E7%99%BE%E5%BA%A6%E6%96%87%E5%BA%93/4928294?fr=aladdin"
}
3、传递请求参数
response = requests.get("https://baike.baidu.com/item/%E4%B8%AD%E5%9B%BD%E5%9C%B0%E8%B4%A8%E5%A4%A7%E5%AD%A6%EF%BC%88%E6%AD%A6%E6%B1%89%EF%BC%89/9272346?fromtitle=%E4%B8%AD%E5%9B%BD%E5%9C%B0%E8%B4%A8%E5%A4%A7%E5%AD%A6&fromid=249083",headers=headers)
4、打印查看相关输出信息
print(response.text)
<!DOCTYPE html>
<!--STATUS OK-->
<html>
<head>
<meta charset="UTF-8">
<meta http-equiv="X-UA-Compatible" content="IE=Edge" />
<meta name="referrer" content="always" />
<meta name="description" content="中国地质大学,简称地大,位于武汉市,是中华人民共和国教育部直属全国重点大学,是国家“世界一流学科建设高校”,国家“211工程”、“985工程优势学科创新平台”建设高校,是国家批准设立研究生院的大学,入选国家“111计划”、卓越工程师教育培养计划、国家建设高水平大学公派研究生项目、中国政府奖学金来华留学生接收院校、首批高等学校科技成果转化和技术转移基地,高水平行业特色大学优质资源共享联盟、地球科学国...">
5、将爬取信息写入文件,保存在本地
with open("result.txt","w",encoding="utf-8") as fp:
fp.write(response.text)
fp.close()