关于数据挖掘所需Python环境的搭建以及库与编译器的安装教程

前言

  在望眼欲穿的长久等待之后,这学期终于开设了商务智能课程。鉴于许多同学是Python新手,特开此贴来进行简单教学,希望对大家有所帮助。需要注意的是,涉及数据挖掘的方法实现并不仅限于Python这一种语言,只是目前业界普遍偏好于使用这一种易于学习和使用的语言。
  本文主要包括三部分内容:Windows下Python的安装、安装IDE:PyCharm、安装使用数据挖掘所使用的库。本文只介绍Windows环境的相关安装配置,苹果用户毕竟还是少数请你们按照本文流程自行谷歌或者百度。Linux用户……你们都用Linux了我相信是这点操作还是毫无难度的(滑稽)。

1 Windows下Python的安装

1.1 在官网下载数据包

  Python官网网址:www.python.org。打开之后选择主页上的Downloads。
  在“Looking for a specific release”下的列表中选择指定的Python版本,这里我选择3.5.4版本进行安装。点击列表中的Python 3.5.4链接。在弹出的网页下方的Files中选择合适的版本进行下载*(该页网页链接)。

由于后期我们还需要安装第三方库,考虑到Python环境与库的兼容性(特别像是TensorFlow这种比较难缠的库),这里我建议安装3.5.x版本。注意:不是越新版本的Python环境就是最好的,也不要选择老旧的2.x版本。

  Windows版本安装文件分x86以及x64两种,请根据自己系统类型来选择合适的版本。根据天朝的网络状况建议选择压缩包或者可执行文件进行下载。
  不知道自己电脑的系统类型?
    win7点这里学习如何查看自己电脑系统类型
    win10点这里学习如何查看自己电脑系统类型
  关于文件列表中各种文件的解释如下:

Windows x86-64 embeddable zip file  压缩打包后的64位的安装包
Windows x86-64 executable installer 64位可执行安装文件
Windows x86-64 web-based installer  64位联网方式安装文件(打开后还需继续下载数据)
Windows x86 embeddable zip file     压缩打包后的32位的安装包
Windows x86 executable installer    32位可执行安装文件
Windows x86 web-based installer     32位联网方式安装文件(打开后还需继续下载数据)

此外,官网还提供了Python的说明文档,这个文件在各个版本的文件链表中都可以找到,应该都是多语种的(太新的来不及汉化的除外)。

1.2 Python安装

  双击下载得到的exe文件(或者解压后得到)。首先勾选Add Python 3.5 to PATH是把Python的安装路径添加到系统环境变量的Path变量中(这样我们就不需要手动添加环境变量了),然后选择Install Now默认将Python安装在C盘目录下,或者选择Customize installation可自定义路径。这里我们选择Customize installation
  Optional Features这一步默认全选,然后点击next进行下一步(最主要是要安装里面的pip)。
  Advanced Options里Install for all users勾不勾选都可以看自己需求。最下面可以指定安装路径,建议就默认的装在C盘不要动了,反正也不会占用多少空间。然后点击Install,等待安装结束,提示安装成功之后点击close关闭安装界面。

1.3 验证安装以及环境变量配置是否正常

  按下WIndows + R键,在运行输入框中输入cmd,回车进入命令行(即命令提示符程序)。在打开的黑色背景命令行窗口中输入python后回车,如无意外应提示形如以下文本的内容:

Python 3.5.4 (v3.5.4:3f56838, Aug  8 2017, 02:17:05) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.

  若显示了如上提示,说明安装配置成功。此时我们已经进入了Python运行环境,可以运行Python语句了。输入以下命令完成老师的Hello World作业(输入内容不包括最前面的三个大于号):

>>> print("Hello World")

  系统返回内容:Hello World
  测试完毕,按下Ctrl + Z键(会在命令行显示^Z),然后回车退出Python运行环境。之后输入exit退出命令行环境。

2 安装IDE:PyCharm

这里的IDE我选用的是PyCharm,同学们也可以选择其他的编译器安装使用。

2.1 PyCharm的下载和安装

  首先去Pycharm官网,或者直接输入网址:http://www.jetbrains.com/pycharm/download/#section=windows(这个链接仅供Windows平台的同学打开,其他平台的同学请自行在官网找到下载链接),下载PyCharm安装包(点选Community下面的Download即可,专业版需另行购买)。
  下载完成之后双击安装包,点击下一步,在Choose Install Location界面选择安装目录。C盘空间比较大的可以直接按照默认安装在C盘(接近700M大小),否则请另行制定其他分区的安装路径。
  点击下一步,在Installation Options界面选择在桌面创建符合自己系统类型的快捷方式(可以不选),在第二行Create Association里勾选.py创建与该类型文件的关联(打开此类型文件不再需要指定打开方式了)。最后一路下一步一直到提示安装完成,点击Finish。

2.2 PyCharm首次开启的配置

  双击运行桌面上的Pycharm图标(或者刚才安装结束勾选了Run PyCharm直接打开程序),在Complete Installation里选Do not import settings,之后选择OK,之后一路下一步。愿意折腾的可以看看过程内容提示,还涉及编译器界面和安装功能组件之类的设置。建议选择Darcula主题,该主题更有利于保护眼睛,而且看上去也非常不错(逼格高)。

2.3 正式运行PyCharm

  配置完毕之后弹出Welcome to PyCharm界面,点击Create New Project,再指定工程存放位置。设置完毕,点击Create。

  下拉列表中的解释器主要用于多Python环境中特定版本环境的指定,如果Python环境变量的配置都没有问题的话解释器是可以正常识别到并匹配的。
  此外,如果需要使用系统中已经通过pip安装好的库的话,请勾选“Inherit global site-packages”。这部分内容我将在本文的后半部分进行描述。

  IDE提供的提示直接close即可,不用理会。当然还是建议看一下学习学习快捷键的使用之类。
  如图,将工程视图调整为Project Files,然后右键选择工程,指向New,选择Python File,新建一个.py文件。命名之后选择OK,打开这个文件。
  这里写图片描述
  这里我们还是以输出Hello World来进行测试。在代码区域输入print("Hello World")之后,在菜单栏选择Run,点击下拉列表中的Run(或者按下图片显示的快捷键)。
  这里写图片描述
  在弹出的小窗口中单击左键选择我们刚刚新建的这个文件。(上面告诉你按住Shift点击可以进行Debug)
  这里写图片描述
  然后就可以在下面的命令行区域看到运行效果了:
  这里写图片描述

3 库的安装

  Python的库又叫做包或者模块,使我们实现数据挖掘工作的过程中不可缺少的工具。大多数的库都是开源的,在Github等平台都可以找到和下载。
  我们在使用PyCharm编写程序的时候如果需要使用第三方库有两种方式:一种是直接调用系统中已经安装好的库,这个操作可以参考前面2.3节中的引用部分文本,需要注意这个操作只能在工程创建时指定,若工程已创建且创建时未勾选Inherit global site-packages选项卡,则无法使用这一方法,只能重新建立工程;另一种方法是直接使用PyCharm中的包管理器进行第三方库的安装使用,不过这种安装使用只是针对当前工程而言,其他工程并不能直接使用,但可以继承当前工程的各种库,当然这个操作比较繁琐,本文也不多介绍,大家可以自行学习一下。
 

3.1 将库直接安装到系统中去

3.1.1 pip安装(推荐)

  这是最常用也是最简单的python安装方法。新版的python一般自带pip.exe程序。
  Win + R 打开运行窗口,输入cmd回车,进入命令提示符。在命令行中直接输入pip install [some-package-name]即可安装。比如现在要安装requests这个库,我们可以输入命令:

pip install requests

  这样 requests 这个第三方库就下载和安装完成了。
  在你的脚本中添加:import requests,就可以使用这个 Requests 库。
  我们还可以升级到指定版本的库,可以运行这样的命令,当然前提是你非常清楚这个库的对应版本号:

pip3 install --upgrade [some-package-name]==[version]

  比如:

pip3 install --upgrade tensorflow==1.1.0rc2

  如果是全新安装,在命令中删除--upgrade参数即可。
  此外,如果你在执行pip install [some-package-name] 命令的时候,它输出:没有找到这样的软件包。比如执行:pip install opencv 命令,命令行会输出:

Could not find a version that satisfies the requirement opencv (from versions: )
No matching distribution found for opencv

  遇到这种情况多半是撞墙的原因。这时,我们就需要手动下载相关第三方库的安装包了。

3.1.2 手动下载whl文件,并使用pip来安装

  使用pip 安装时,有时会遇到网上慢或者撞墙的现象,这时我们就到这个网站手动下载你需要的安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/。这个网站里面的Python第三方库可以说是包罗万象。
  举例:安装 opencv 第三方库(也就是前面直接使用pip安装结果因为撞墙安装失败了的库)
  Step 1 . 点击上面链接进入这个网站
  Step 2 . 按组合键:Ctrl + F 查找关键词:opencv, 点击搜索出来的高亮的opencv链接。现在你能看到下面的 opencv 版本,因为我使用的是 Python 3.5.4 版本,并且我的电脑是64位的,所以我选择下载:opencv_python-3.1.0-cp35-cp35m-win_amd64.whl
  Step 3 . 下载它,并记下下载到本地的路径/位置
  Step 4 . 下载完成后,在命令提示符窗口中(如何打开?看前面,已经说了两次了),执行下面的命令(其中软件包要输入绝对路径):

pip install D:\Downloads\opencv_python-3.1.0-cp35-cp35m-win_amd64.whl

  成功安装,输出下面信息:

Processing d:\downloads\opencv_python-3.1.0-cp35-cp35m-win_amd64.whl
Installing collected packages: opencv-python
Successfully installed opencv-python-3.1.0

  需要指出的是,如果我下载的是:opencv_python-2.4.13-cp27-cp27m-win_amd64.whl(错误的版本),那么我在使用pip install D:\Downloads\opencv_python-2.4.13-cp27-cp27m-win_amd64.whl命令进行安装时,会输出下面的信息:

opencv_python-2.4.13-cp27-cp27m-win_amd64.whl is not a supported wheel on this platform.

  这说明opencv的软件包我下载错了,即这个软件包不支持Python3.5.0版。

3.1.3 pip 工具升级

  如果你在执行 pip 命令时发现有形如下面的输出:

You are using pip version 9.0, however version 18.0 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.

  这就是在提示你:你目前的 pip 工具的版本不是最新的,需要更新。你完全可以不用管它,但是我是一个比较讲究的人,所以可以通过执行提示文本中这条的命令来更新:

python -m pip install --upgrade pip

3.2 在PyCharm中直接安装第三方库

  在PyCharm中点击左上角File—>setting,选择弹出界面左上角的Project: [Project-name]—>project Interpreter,再点击右上方“+”进入搜索第三方库的界面。在搜索框中搜索对应想安装的库或者模块,点击左下方“Install package”就行了。
  若是网络环境可以,那么就可以成功添加第三方库拉。然而,天朝的网络有时就那么不可描述,安装可能会不成功,这时候还需要点备用方案。看到那个Manage Repositories了吗,点击,会出现一个框框,点击右边那个+号,可以添加一些国内资源镜像,比如豆瓣http://pypi.douban.com/simple/,当然也可以添加一些其它的,比如阿里的,http://mirrors.aliyun.com/pypi/simple/,以及https://pypi.mirrors.ustc.edu.cn/simple/(https,推荐这个)这时候点击ok,然后上一个图片中的列表在刷新后就会有条目出现了。
  如果安装完成,该库显示字体颜色会变成蓝色,并且在上一个界面罗列出你已安装的库。

4 最后

半夜码字,好累=_= 本文创作匆忙,若有问题请联系我进行订正。希望大家学习愉快。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值