上次说要做一个http://www.m4493.cn/的美女站点,需要使用python进行数据采集
接下来我们就开始采集数据了,使用pythn采集第一步
安装python
这个简单,直接到python官方网站下载python,我这里下载的是2,7.3版本
(找时间把安装过程放出来)
然后安装pip
python ../window/get-pip.py 这里需要去下载pip.py
最后安装一列模块,如下
pip install grab --timeout 600
pip install requests --timeout 600
pip install lxml --timeout 600
pip install selenium --timeout 600
pip install bs4 --timeout 600
pip install pycurl --timeout 600
pip install redis --timeout 600
pip install pycurl --timeout 600
pip install html5lib --timeout 600
对了,记得安装下python的开发工具,我这里使用的是JetBrains PyCharm 2017.1.4 ,这个是需要收费工具,如果没钱破解吧:)
与君共勉:——)