关于Python学习１－－爬虫基础

最新推荐文章于 2024-04-01 13:30:49 发布

RolleDev

最新推荐文章于 2024-04-01 13:30:49 发布

阅读量147

点赞数

分类专栏： Python Python学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zrds2e/article/details/75213311

版权

假如当你看到这篇文章的时候你已经学会了python的基础知识　，假设你也已经安装好了环境变量等．那么还说什么，让我们走入爬虫的世界，我爱学习，学习爱我．

爬虫可以简单的从这三步出发

抓取网页，分析页面，和存储数据

当我们写程序的时候，需要用代码来实现模拟浏览器向服务器发出请求，所有我们需要了解http知识，以及相应的Python库．

python自带了一些库，但是不够，需要安装一下额外的

linux环境下

pip install requests

以及一些wheel，selenium，ChromeDriver

其中linux 中一路执行

sudo mv geckodriver /usr/bin

vi ~/.profile

export PATH=”$PATH:/usr/local/geckodriver”

source ~/.profile

配置完成后，就可以在命令行下直接执行geckodriver命令测试：

geckodriver

然后运行以下代码

from selenium import webdriver
browser = webdriver.Firefox()

如果运行之后弹出一个空白页面，就没问题了

如何爬去网页,其实就是根据URL来获取它的网页信息

比如

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于Python学习１－－爬虫基础

假如当你看到这篇文章的时候你已经学会了python的基础知识　，假设你也已经安装好了环境变量等．那么还说什么，让我们走入爬虫的世界，我爱学习，学习爱我．爬虫可以简单的从这三步出发抓取网页，分析页面，和存储数据当我们写程序的时候，需要用代码来实现模拟浏览器向服务器发出请求，所有我们需要了解http知识，以及相应的Python库．python自带了一些库，但是不够，需要安装一...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。