最近在学习使用python爬虫
一 在安装Scrapy工具包的时候,安装环境:Win10 64位(Win 7亦可参考),python 3.6.3
出现以下问题:
- building ‘twisted.test.raiser’ extension
- error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”:http://landinghub.visualstudio.com/visual-cpp-build-tools
解决办法:
此处因为环境缺省相关whl文件,需要到点击此处打开下载页面
在该页面搜索Twisted,查找你所需要的Twisted文件,这里由于我的环境是python3.6和64位环境故选择倒数第三个并下载
由于我下载后放到了目录: C:\Users\think\Downloads
所以在cmd中切换到对应目录: cd /d C:\Users\think\Downloads
然后输入命令安装: pip install C:\Users\think\Downloads\Twisted-18.9.0-cp36-cp36m-win_amd64.whl
安装成功后,继续安装Scrapy即可
pip install Scrapy
也可以在安装Scrapy之前更新一下pip程序
pip install --upgrade pip
二 安装scrapy成功后编写第一个爬虫程序并执行(按照官方文档的示例):scrapy crawl quotes
出现报错信息:
- ModuleNotFoundError: No module named ‘win32api’
解决办法:这个问题跟上一个问题类似,也是缺少相关依赖文件/包(whl)所致,有两种途径解决
- 找到对应的whl文件下载并在cmd中使用命令install;
- 直接使用命令
pip install pypiwin32
下载安装一步到位。
执行命令pip install pypiwin32
时有可能出现下载安装第三方库超时的问题:Read timed out.
可以更改超时时间设置:
pip --default-timeout=100 install -U Pillow
但这种方法只是延长等待,如果还是不行,建议检查下是否网络问题,或者更换国内镜像。
End