Python开发爬虫挺不错,主要是语言简便,还有很多的相关库和例子,这篇文章首先介绍python的环境配置。
1、下载python
官网:https://www.python.org/downloads/
直接下载最新版本并安装,注意选择系统一致的版本型号。安装时勾选创建path路径,省的我们再自己动手。然后一路next到底,选择安装项时可以全选,反正也不大。
安装后,打开cmd,输入:python,如下:
说明安装成功,PS:exit() 命令可以退出。
2、开发python方式
你可以在cmd窗口用shell命令一行一行写,打开cmd,输入python,一行一行写代码(估计没人这么干╮(╯_╰)╭)。
用文本编辑器编写好代码,保存为“.py”文件,然后用cmd命令:python xxx.py 运行。
用python自带的IDLE(位于:python安装文件夹\Lib\idlelib\idle.bat)开发。
用第三方集成的IDE来开发
3、安装pycharm
上一节介绍了python的开发方式。这里针对最后一种情况,介绍一款IDE软件:pycharm
下载地址:http://www.jetbrains.com/pycharm/download/download-thanks.html?platform=windows&code=PCC
pycharm分为专业版和社区版,专业版是收费的,不过只要不是公司大项目开发,社区版足够了。
下载安装,一键next到底非常方便:
4、HelloWorld
新建项目和py文件,照例给出一个测试程序,不过不是helloworld,是访问百度首页并输出网页源代码:
import urllib.request
response = urllib.request.urlopen('http://www.baidu.com')
html = response.read()
print(html)