python爬虫相关库的下载配置

BeautifulSoup4 : 解析HTML

//安装:
pip install beautifulsoup4

lxml : 解析HTML

1.安装lxml:

pip install lxml

2.wheel下载

wheel下载地址

找到lxml的位置,会看到一系列.whl文件,根据自己的Python版本和Windows版本选择相应的文件下载,

cp代表Python版本,cp35指Python3.5,win32指Windows32位,amd64指Windows64位。下载后不要修改文件名。

3.wheel安装

pip install lxml-4.2.5-cp27-cp27m-win_amd64.whl

requests : HTTP库

python实现的简单易用的HTTP库,使用起来比urllib简洁很多

//安装:
pip install requests

requests快速上手文档

其他

pip版本

pip --version

pip版本过低进行升级

python -m pip install --upgrade pip

查看python安装的包:

pip list

python解析HTML的方式对比

抓取工具速度使用难度安装难度
正则最快困难无(内置)
beautifulsoup最简单简单
lxml简单一般

pycharm下载库

注意: 除了使用easy_insatll和pip工具安装Python第三方库外还可以使用pycharm安装Python第三方库,步骤如下:

在这里插入图片描述

点击Install Package即可安装此库。

安装scrapy

准备工作:下载 .whl 文件

打开 https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml 搜索 lxml 、 Twisted 并下载
得到以下文件:

lxml-4.2.5-cp27-cp27m-win_amd64.whl

Twisted-18.9.0-cp27-cp27m-win_amd64.whl

在这里插入图片描述

在这里插入图片描述

注意:

根据自己的Python版本和Windows版本选择相应的文件下载,

cp代表Python版本,cp35指Python3.5,

win27指Windows27位,amd64指Windows64位。

下载后不要修改文件名。

//安装lxml
pip install lxml
//进入到 lxml-4.2.5-cp27-cp27m-win_amd64.whl 目录下:
pip install lxml-4.2.5-cp27-cp27m-win_amd64.whl

//安装Twisted
//进入到 Twisted-18.9.0-cp27-cp27m-win_amd64.whl 目录下:
pip install Twisted-18.9.0-cp27-cp27m-win_amd64.whl

安装pywin32

https://sourceforge.net/projects/pywin32/files/pywin32/Build 221/

注意:要跟python版本和windows版本一致:

64位系统选amd64 , python版本2.7选py2.7

安装pyOpenSSL

pip install pyOpenSSL

安装wheel

//首先安装wheel
pip install wheel

//安装完成后验证是否成功
wheel

//https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml
//搜索scrapy并下载,cmd到目录进行安装
pip install Scrapy-1.5.1-py2.py3-none-any.whl

在这里插入图片描述

安装scrapy

首先scrapy的安装之前需要安装这个模块:

wheel、lxml、Twisted、pywin32,最后在安装scrapy

pip install Scrapy

创建scrapy项目:

新建python项目:

在这里插入图片描述

在pycharm的terminal中输入scrapy startproject module(自定义模块名)

在这里插入图片描述

建好后可查看到项目结构
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值