《Python3网络爬虫开发实战》爬虫有关库的安装

请求库

requests

pip install requests

selenium 模拟浏览器操作

pip install selenium

ChromeDriver 谷歌浏览器驱动

下载chrome浏览器对应的chromedriver.exe版本文件

将chromedriver.exe文件放到Python的Scripts目录下 / 将其路径配置到环境变量

GeckoDriver 火狐浏览器驱动

下载geckodriver.exe文件

将geckodriver.exe文件放到Python的Scripts目录下 / 将其路径配置到环境变量

PhantomJS 无界面的WebKit浏览器引擎

下载PhantomJS压缩包文件

解压后将bin文件夹中的phantomjs.exe文件放到Python的Scripts目录下 / 将其所在的bin目录路径配置到环境变量

aiohttp Web请求库

pip install aiohttp

官方推荐安装如下两个库:

cchardet 字符编码检测库

aiodns 加速DNS解析库

pip install cchardet aiodns

 

解析库

lxml 支持HTML和XML解析的解析库

pip install lxml

Beautiful Soup 支持HTML和XML解析的解析库

pip install beautifulsoup4

pyquery 支持HTML解析的解析库

pip install pyquery

tesserocr OCR识别库,用于识别图片验证码

下载安装tesseract软件

安装tesserocr

pip install tesserocr pillow

 

数据库

MySQL 轻量级关系型数据库

下载安装MySQL软件

在“计算机-管理-服务”中开启或关闭MySQL服务

MongoDB 非关系型数据库

下载安装MongoDB软件

新建data文件夹……(太长暂时略过)

Redis 基于内存的非关系型数据库

下载安装Redis

(可选)下载安装Redis Desktop Manager可视化管理工具

 

Python数据库存储库

PyMySQL Python与MySQL交互库

pip install pymysql

PyMongo Python与MongoDB交互库

pip install pymango

redis-py Python与Redis交互库

pip install redis

ReidsDump Redis数据导入/导出工具

安装Ruby

安装ReidsDump

gem install redis-dump

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值