最近在学习数据分析相关的知识,对比Python和R语言在数据分析领域的优劣,Python更胜一筹。 要学习Python,首先需要搭建编译环境。
一. 编译工具的选择
Python的编译工具有两种,
1. 文本编辑器,Sublime Text 3, (还有vim, Vistual Studio Code), 此处重点介绍Sublime Text 3
2. 集成开发环境(IDE), 主要有pycharm python, iclipse python, Anaconda
二. 为Sublime Text 3配置Python环境
1. 下载Sublime Text 3
2) 选择OS X对应的链接就可以下载, 下载链接如下:
2. Sublime Text 3 安装 Package Control,
Package control里面包含了很多插件,安装好以后可以选择需要的安装
1) 使用Ctrl+`快捷键或通过View->Show Console菜单打开命令行,粘贴如下代码:
import urllib.request,os; pf = 'Package Control.sublime-package'; ipp = sublime.installed_packages_path(); urllib.request.install_opener( urllib.request.build_opener( urllib.request.ProxyHandler()) ); open(os.path.join(ipp, pf), 'wb').write(urllib.request.urlopen( 'http://sublime.wbond.net/' + pf.replace(' ','%20')).read())
3. 安装运行python需要的插件
1). 安装好package control后,Preferences菜单下选择“Package Control” , 会出现如下界面
2). 选择: Package Control: Install Package, 出现如下界面, 可以再搜索框中输入你想要安装的插件
这里我们需要安装两个插件:
a. Anaconda , 这是python插件
b. SublimeCodeIntel , 输入提示插件,安装后,在输入代码的时候会有提示
4. 安装第三方数据分析库
1). 数据分析需要的几个常用库
-- numpy, python科学计算的基础库
-- matplotlib, 是python的一个图形框架
-- scipy, 一个函数库,在NumPy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等
-- pandas, 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包
-- scikit-learn, 机器学习库
-- gensim, 文本处理库
2). 安装numpy
在terminal 输入: sudo pip install numpy, (第三方库一般都是在Terminal用pip命令安装)
* 如果出现pip命令找不到的错误,可以输入:
sudo easy_install pip
这样terminal会自动下载并安装,等待安装完成即可
3). 安装其他库
在Terminal中依次输入如下命令安装相应的库即可:
sudo pip install numpy
sudo pip install matplotlib
sudo pip install scipy
sudo pip install pandas
sudo pip install scikit-learn
sudo pip install gensim
三. 第一个Python程序
启动Sublime Text 3, 新建一个文件
输入: print "Hello, world!"
保存为后缀名为.py的文件
Command+B,即可在下方的输出窗口看到运行结果。 到此,你已经完成了第一个Python程序了。