前言
在望眼欲穿的长久等待之后,这学期终于开设了商务智能课程。鉴于许多同学是Python新手,特开此贴来进行简单教学,希望对大家有所帮助。需要注意的是,涉及数据挖掘的方法实现并不仅限于Python这一种语言,只是目前业界普遍偏好于使用这一种易于学习和使用的语言。
本文主要包括三部分内容:Windows下Python的安装、安装IDE:PyCharm、安装使用数据挖掘所使用的库。本文只介绍Windows环境的相关安装配置,苹果用户毕竟还是少数请你们按照本文流程自行谷歌或者百度。Linux用户……你们都用Linux了我相信是这点操作还是毫无难度的(滑稽)。
1 Windows下Python的安装
1.1 在官网下载数据包
Python官网网址:www.python.org。打开之后选择主页上的Downloads。
在“Looking for a specific release”下的列表中选择指定的Python版本,这里我选择3.5.4版本进行安装。点击列表中的Python 3.5.4链接。在弹出的网页下方的Files中选择合适的版本进行下载*(该页网页链接)。
由于后期我们还需要安装第三方库,考虑到Python环境与库的兼容性(特别像是TensorFlow这种比较难缠的库),这里我建议安装3.5.x版本。注意:不是越新版本的Python环境就是最好的,也不要选择老旧的2.x版本。
Windows版本安装文件分x86以及x64两种,请根据自己系统类型来选择合适的版本。根据天朝的网络状况建议选择压缩包或者可执行文件进行下载。
不知道自己电脑的系统类型?
win7点这里学习如何查看自己电脑系统类型
win10点这里学习如何查看自己电脑系统类型
关于文件列表中各种文件的解释如下:
Windows x86-64 embeddable zip file 压缩打包后的64位的安装包
Windows x86-64 executable installer 64位可执行安装文件
Windows x86-64 web-based installer 64位联网方式安装文件(打开后还需继续下载数据)
Windows x86 embeddable zip file 压缩打包后的32位的安装包
Windows x86 executable installer 32位可执行安装文件
Windows x86 web-based installer 32位联网方式安装文件(打开后还需继续下载数据)
此外,官网还提供了Python的说明文档,这个文件在各个版本的文件链表中都可以找到,应该都是多语种的(太新的来不及汉化的除外)。
1.2 Python安装
双击下载得到的exe文件(或者解压后得到)。首先勾选Add Python 3.5 to PATH是把Python的安装路径添加到系统环境变量的Path变量中(这样我们就不需要手动添加环境变量了),然后选择Install Now默认将Python安装在C盘目录下,或者选择Customize installation可自定义路径。这里我们选择Customize installation。
Optional Features这一步默认全选,然后点击next进行下一步(最主要是要安装里面的pip)。
Advanced Options里Install for all users勾不勾选都可以看自己需求。最下面可以指定安装路径,建议就默认的装在C盘不要动了,反正也不会占用多少空间。然后点击Install,等待安装结束,提示安装成功之后点击close关闭安装界面。
1.3 验证安装以及环境变量配置是否正常
按下WIndows + R键,在运行输入框中输入cmd,回车进入命令行(即命令提示符程序)。在打开的黑色背景命令行窗口中输入python后回车,如无意外应提示形如以下文本的内容:
Python 3.5.4 (v3.5.4:3f56838, Aug 8 2017, 02:17:05) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
若显示了如上提示,说明安装配置成功。此时我们已经进入了Python运行环境,可以运行Python语句了。输入以下命令完成老师的Hello World作业(输入内容不包括最前面的三个大于号):
>>> print("Hello World")
系统返回内容:Hello World
。
测试完毕,按下Ctrl + Z键(会在命令行显示^Z),然后回车退出Python运行环境。之后输入exit退出命令行环境。
2 安装IDE:PyCharm
这里的IDE我选用的是PyCharm,同学们也可以选择其他的编译器安装使用。
2.1 PyCharm的下载和安装
首先去Pycharm官网,或者直接输入网址:http://www.jetbrains.com/pycharm/download/#section=windows(这个链接仅供Windows平台的同学打开,其他平台的同学请自行在官网找到下载链接),下载PyCharm安装包(点选Community下面的Download即可,专业版需另行购买)。
下载完成之后双击安装包,点击下一步,在Choose Install Location界面选择安装目录。C盘空间比较大的可以直接按照默认安装在C盘(接近700M大小),否则请另行制定其他分区的安装路径。
点击下一步,在Installation Options界面选择在桌面创建符合自己系统类型的快捷方式(可以不选),在第二行Create Association里勾选.py创建与该类型文件的关联(打开此类型文件不再需要指定打开方式了)。最后一路下一步一直到提示安装完成,点击Finish。
2.2 PyCharm首次开启的配置
双击运行桌面上的Pycharm图标(或者刚才安装结束勾选了Run PyCharm直接打开程序),在Complete Installation里选Do not import settings,之后选择OK,之后一路下一步。愿意折腾的可以看看过程内容提示,还涉及编译器界面和安装功能组件之类的设置。建议选择Darcula主题,该主题更有利于保护眼睛,而且看上去也非常不错(逼格高)。
2.3 正式运行PyCharm
配置完毕之后弹出Welcome to PyCharm界面,点击Create New Project,再指定工程存放位置。设置完毕,点击Create。
下拉列表中的解释器主要用于多Python环境中特定版本环境的指定,如果Python环境变量的配置都没有问题的话解释器是可以正常识别到并匹配的。
此外,如果需要使用系统中已经通过pip安装好的库的话,请勾选“Inherit global site-packages”。这部分内容我将在本文的后半部分进行描述。
IDE提供的提示直接close即可,不用理会。当然还是建议看一下学习学习快捷键的使用之类。
如图,将工程视图调整为Project Files,然后右键选择工程,指向New,选择Python File,新建一个.py文件。命名之后选择OK,打开这个文件。
这里我们还是以输出Hello World来进行测试。在代码区域输入print("Hello World")
之后,在菜单栏选择Run,点击下拉列表中的Run(或者按下图片显示的快捷键)。
在弹出的小窗口中单击左键选择我们刚刚新建的这个文件。(上面告诉你按住Shift点击可以进行Debug)
然后就可以在下面的命令行区域看到运行效果了:
3 库的安装
Python的库又叫做包或者模块,使我们实现数据挖掘工作的过程中不可缺少的工具。大多数的库都是开源的,在Github等平台都可以找到和下载。
我们在使用PyCharm编写程序的时候如果需要使用第三方库有两种方式:一种是直接调用系统中已经安装好的库,这个操作可以参考前面2.3节中的引用部分文本,需要注意这个操作只能在工程创建时指定,若工程已创建且创建时未勾选Inherit global site-packages选项卡,则无法使用这一方法,只能重新建立工程;另一种方法是直接使用PyCharm中的包管理器进行第三方库的安装使用,不过这种安装使用只是针对当前工程而言,其他工程并不能直接使用,但可以继承当前工程的各种库,当然这个操作比较繁琐,本文也不多介绍,大家可以自行学习一下。
3.1 将库直接安装到系统中去
3.1.1 pip安装(推荐)
这是最常用也是最简单的python安装方法。新版的python一般自带pip.exe程序。
Win + R 打开运行窗口,输入cmd回车,进入命令提示符。在命令行中直接输入pip install [some-package-name]
即可安装。比如现在要安装requests这个库,我们可以输入命令:
pip install requests
这样 requests 这个第三方库就下载和安装完成了。
在你的脚本中添加:import requests
,就可以使用这个 Requests 库。
我们还可以升级到指定版本的库,可以运行这样的命令,当然前提是你非常清楚这个库的对应版本号:
pip3 install --upgrade [some-package-name]==[version]
比如:
pip3 install --upgrade tensorflow==1.1.0rc2
如果是全新安装,在命令中删除--upgrade
参数即可。
此外,如果你在执行pip install [some-package-name]
命令的时候,它输出:没有找到这样的软件包。比如执行:pip install opencv
命令,命令行会输出:
Could not find a version that satisfies the requirement opencv (from versions: )
No matching distribution found for opencv
遇到这种情况多半是撞墙的原因。这时,我们就需要手动下载相关第三方库的安装包了。
3.1.2 手动下载whl文件,并使用pip来安装
使用pip 安装时,有时会遇到网上慢或者撞墙的现象,这时我们就到这个网站手动下载你需要的安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/。这个网站里面的Python第三方库可以说是包罗万象。
举例:安装 opencv 第三方库(也就是前面直接使用pip安装结果因为撞墙安装失败了的库)
Step 1 . 点击上面链接进入这个网站
Step 2 . 按组合键:Ctrl + F 查找关键词:opencv, 点击搜索出来的高亮的opencv链接。现在你能看到下面的 opencv 版本,因为我使用的是 Python 3.5.4 版本,并且我的电脑是64位的,所以我选择下载:opencv_python-3.1.0-cp35-cp35m-win_amd64.whl
Step 3 . 下载它,并记下下载到本地的路径/位置
Step 4 . 下载完成后,在命令提示符窗口中(如何打开?看前面,已经说了两次了),执行下面的命令(其中软件包要输入绝对路径):
pip install D:\Downloads\opencv_python-3.1.0-cp35-cp35m-win_amd64.whl
成功安装,输出下面信息:
Processing d:\downloads\opencv_python-3.1.0-cp35-cp35m-win_amd64.whl
Installing collected packages: opencv-python
Successfully installed opencv-python-3.1.0
需要指出的是,如果我下载的是:opencv_python-2.4.13-cp27-cp27m-win_amd64.whl(错误的版本),那么我在使用pip install D:\Downloads\opencv_python-2.4.13-cp27-cp27m-win_amd64.whl
命令进行安装时,会输出下面的信息:
opencv_python-2.4.13-cp27-cp27m-win_amd64.whl is not a supported wheel on this platform.
这说明opencv的软件包我下载错了,即这个软件包不支持Python3.5.0版。
3.1.3 pip 工具升级
如果你在执行 pip 命令时发现有形如下面的输出:
You are using pip version 9.0, however version 18.0 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.
这就是在提示你:你目前的 pip 工具的版本不是最新的,需要更新。你完全可以不用管它,但是我是一个比较讲究的人,所以可以通过执行提示文本中这条的命令来更新:
python -m pip install --upgrade pip
3.2 在PyCharm中直接安装第三方库
在PyCharm中点击左上角File—>setting,选择弹出界面左上角的Project: [Project-name]—>project Interpreter,再点击右上方“+”进入搜索第三方库的界面。在搜索框中搜索对应想安装的库或者模块,点击左下方“Install package”就行了。
若是网络环境可以,那么就可以成功添加第三方库拉。然而,天朝的网络有时就那么不可描述,安装可能会不成功,这时候还需要点备用方案。看到那个Manage Repositories了吗,点击,会出现一个框框,点击右边那个+号,可以添加一些国内资源镜像,比如豆瓣http://pypi.douban.com/simple/,当然也可以添加一些其它的,比如阿里的,http://mirrors.aliyun.com/pypi/simple/,以及https://pypi.mirrors.ustc.edu.cn/simple/(https,推荐这个)这时候点击ok,然后上一个图片中的列表在刷新后就会有条目出现了。
如果安装完成,该库显示字体颜色会变成蓝色,并且在上一个界面罗列出你已安装的库。
4 最后
半夜码字,好累=_= 本文创作匆忙,若有问题请联系我进行订正。希望大家学习愉快。