Python requests库基础爬取网页信息

最新推荐文章于 2024-04-23 18:06:15 发布

wherehw

最新推荐文章于 2024-04-23 18:06:15 发布

阅读量1.5k

点赞数

本文链接：https://blog.csdn.net/wherehw/article/details/118963670

版权

学习目标：

掌握requests库的基本使用方法

学习内容：

1、爬虫的使用方法：
-指定url
-发起响应
-获取响应数据
-持久化存储
2、案例实现

1）百度页面爬取

下面展示一些 内联代码片。

import requests
if __name__=='__main__':
    url='https://www.baidu.com/'#获取百度的url
    
    response=requests.get(url=url)#发起响应
    #获取响应数据
    page_text=response.text
    #持久化存储
    with open('./baidu.html','w',encoding='utf-8') as fp:
        fp.write(page_text)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wherehw

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python requests库基础爬取网页信息

学习目标：掌握requests库的基本使用方法学习内容：1、爬虫的使用方法：-指定url-发起响应-获取响应数据-持久化存储2、案例实现1）百度页面爬取下面展示一些内联代码片。import requestsif __name__=='__main__': url='https://www.baidu.com/'#获取百度的url response=requests.get(url=url)#发起响应 #获取响应数据 page_text=re
复制链接

扫一扫