python学习爬虫（1）--环境搭建Python+requests+BeautifulSoup

最新推荐文章于 2022-01-07 11:59:44 发布

IT小样

最新推荐文章于 2022-01-07 11:59:44 发布

阅读量242

点赞数

分类专栏： Python爬虫文章标签： Python爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31315135/article/details/88685424

版权

Python爬虫专栏收录该内容

9 篇文章 2 订阅

订阅专栏

作者:IT 小样
爬虫，spider，通过爬虫程序可以爬取到网页你所需要的信息。实现爬虫程序的方法很多，本系列文主要介绍通过Python3+requests+BeautifulSoup来实现代码。
本篇简单介绍一下爬虫流程以及环境搭建

爬虫流程

发起请求——>获取响应数据——>解析数据后获取
发起请求获取响应数据，可以通过requests库来实现，而解析数据可以通过BeautifulSoup库来实现。这两个库使用起来相比其他方法会更简单便捷。

安装python

首先下载Python安装包，建议直接安装python3，最新版本即可。在安装时注意勾选添加路径至系统路径中，这样可以直接在命令行运行python命令而不用切换路径。

安装requests库

可以直接pip安装，pip install requests

安装BeautifulSoup

pip安装，pip install bs4
使用BeautifulSoup时，需要from bs4 import BeautifulSoup
此处还需要pip安装解析器 lxml，pip install lxml
安装lxml解析器的原因是因为其比Python自带的html.parser解析器效率更高,建议安装。

至此，基本上环境已经搭建完毕。

下一篇：Python学习爬虫（2）–requests库

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。