关于Python学习1--爬虫基础

假如当你看到这篇文章的时候你已经学会了python的基础知识 ,假设你也已经安装好了环境变量等.那么还说什么,让我们走入爬虫的世界,我爱学习,学习爱我.


爬虫可以简单的从这三步出发

抓取网页, 分析页面,和存储数据

当我们写程序的时候,需要用代码来实现模拟浏览器向服务器发出请求,所有我们需要了解http知识,以及相应的Python库.

python自带了一些库,但是不够,需要安装一下额外的

linux环境下

  • pip install requests

以及一些wheel,selenium,ChromeDriver

其中linux 中一路执行

sudo mv geckodriver /usr/bin

vi ~/.profile

export PATH=”$PATH:/usr/local/geckodriver”

source ~/.profile

配置完成后,就可以在命令行下直接执行geckodriver命令测试:

geckodriver

然后运行以下代码

from selenium import webdriver
browser = webdriver.Firefox()

如果运行之后弹出一个空白页面,就没问题了

如何爬去网页,其实就是根据URL来获取它的网页信息

比如

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值