python爬虫(二)-编写第一个小爬虫

1.下载requests库

打开pycharm点击控制台
在这里插入图片描述
再控制台中输入pip install requests下载requests库

pip install requests

在这里插入图片描述
successfully表示安装成功

2.编写爬虫

选择网页获取url

我们选择百度首页复制网页url
在这里插入图片描述

import requests                 #导入request库
url='https://www.baidu.com/'    #百度首页
res=requests.get(url)           #用get方法发送请求
print(res)                      #获取状态码200表示获取成功
print(res.text)                 #打印页面源代码

在这里插入图片描述
打开百度首页F12查看页面源代码

在这里插入图片描述
可以看到虽然我们成功获取了页面源代码但是返回结果中会出现中文乱码我们需要对返回的数据进行编码
在这里插入图片描述
查看页面源代码发现编码格式为’utf-8’我们将返回的数据按utf-8进行编码
编码和解码请参考: Python 中的编码与解码(encoding和decoding)

import requests                 #导入request库
url='https://www.baidu.com/'    #百度首页
res=requests.get(url)          #用get方法发送请求
print(res)                     #获取状态码200表示获取成功
res.encoding='utf-8'            #对返回的数据编码
print(res.text)                 #打印页面源代码

在这里插入图片描述
返回的数据中文乱码已解决成功获取页面源代码

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我把把C

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值