2021-10-13爬虫requests总结

最新推荐文章于 2022-07-10 22:25:27 发布

Smiling之菜鸟日常

最新推荐文章于 2022-07-10 22:25:27 发布

阅读量284

点赞数

文章标签：爬虫 python

本文链接：https://blog.csdn.net/weixin_51594673/article/details/120754346

版权

本文介绍了使用Python的requests模块进行网络请求的实践，包括GET和POST方法，以及如何设置User-Agent，处理不同类型的响应数据，并保存为HTML或JSON文件。

摘要由CSDN通过智能技术生成

#requests模块
#网络请求的两个模块：urllib模块；requests模块（模拟浏览器发请求）
#如何使用：指定URL；发起请求；获取响应数据；持久化存储

#requests模块

1.#需求：爬取搜狗首页的页面数据

url=' 网址 '

response=requests.get(url=url)

page_text(或其他名称）=response.text

with open('./sogou.html','w',encoding='utf-8')as fp:
fp.write(page_text)


#需求：爬取搜狗首页的页面数据
import requests
url='https://www.sogou.com/'
response=requests.get(url=url)
page_text=response.text
print(page_text)
with open('./sogou.html','w',encoding='utf-8')as fp:
    fp.write(page_text)
print('爬取数据结束')

2.# 搜狗指定词条对应的搜索结果页面，简易网页采集器
#UA伪装
#UA：User_Agent(请求载体的身份标识)

有参数使用字典形式封装

headers={'user-agent':' '}

url='

最低0.47元/天解锁文章

Smiling之菜鸟日常

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-10-13爬虫requests总结

#requests模块#网络请求的两个模块：urllib模块；requests模块（模拟浏览器发请求）#如何使用：指定URL；发起请求；获取响应数据；持久化存储#requests模块url=' 'response=requests.get(url=url)page_text(或其他名称）=response.text)with open('./sogou.html','w',encoding='utf-8')as fp: fp.write(page_text)#需求...
复制链接

扫一扫