python学习——requests模块

概念:python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高

作用:模拟浏览器发请求

requests模块的编码流程:

(1)指定url

(2)发起请求

(3)获取响应数据

(4)持久化存储

环境安装:

在pycharm中 file->Settings->Project Interpreter 点图中的+号,在弹出来的页面搜索栏中输入requests  再点左下角的Install  Package,出现Package "requests" installed successfully即可

实现编码:例如爬取河科大教育系统首页的页面数据

#导入资源,爬取河科大教育网站的数据
import requests
#1.指定url
if __name__=="__main__":
    url='http://www.haust.edu.cn'
    #2.发起请求,get方法会返回一个响应对象
    response=requests.get(url=url)
    #3.获取响应数据,text返回的是字符串形式的响应数据
    page_text=response.text
    print(page_text)
    #4.持久化存储,将爬取的数据存放在hekeda.html文件中
    with open('./hekeda.html','w',encoding='utf-8') as fp:
        fp.write(page_text)
    print("爬取数据结束")

爬取结果:

以及将结果数据保存在hekeda.html中

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值