如果希望快速开始使⽤ Python
处理数据科学相关的⼯作,建议⼤家直接安装
Anaconda
,然后使⽤
Anaconda
中集成的 Notebook
或
JupyterLab
⼯具来编写代码。因为对于新⼿来说,先安装官⽅的
Python
解释器,再逐个安装⼯作中会使⽤到的三⽅库⽂件会⽐较麻烦,尤其是在 Windows
环境下,经常会因为构建⼯具或
DLL
⽂件的缺失导致安装失败,⽽⼀般新⼿也很难根据错误提示信息采取正确的解决措施,容易产⽣严重的挫败感。如果计算机上已经有 Python
解释器环境了,也可以直接使⽤
Python
的包管理⼯具
pip
安装
Jupyter
,再根据实际⼯作的需要安装三⽅库,这种⽅式适合有⼀定经验的⽤户。
安装和使⽤
Anaconda
对于个⼈⽤户来说,可以从 Anaconda
的
官⽅⽹站
下载它的
“
个⼈版(
Individual Edition
)
”
安装程序,安装完成后,你的计算机上不仅拥有了 Python
环境和
Spyder
(类似于
PyCharm
的集成开发⼯具),还拥有了与数据科学⼯作相关的近200
个⼯具包,包括我们上⾯提到
Python
数据分析三⼤神器。除此之外,
Anaconda
还提供了⼀个名为 conda
的包管理⼯具,通过这个⼯具不仅可以管理
Python
的⼯具包,还可以⽤于创建运⾏
Python
程序的虚拟环境。
![](https://img-blog.csdnimg.cn/3643fa8464d8464ea1360a3b11a8e791.png)
如上图所示,可以通过 Anaconda
官⽹提供的下载链接选择适合⾃⼰操作系统的安装程序,建议⼤家选择图形化的安装程序,下载完成后双击安装程序开始安装。安装过程基本使⽤默认设置即可,完成安装后,macOS
⽤户可以在“
应⽤程序
”
或
“Launchpad”
中找到名为
“Anaconda-Navigator”
的应⽤程序,运⾏该程序可以看到如下所示的界⾯,我们可以在这⾥选择需要执⾏的操作。
![](https://img-blog.csdnimg.cn/11944635ef974bad90a018a6008d7e7f.png)
对于 Windows
⽤户,建议按照安装向导的提示和推荐的选项来安装
Anaconda
(除了安装路径,基本也没有什么需要选择的),安装完成后可以在“
开始菜单
”
中找到
“Anaconda3”
。
温馨提示
:可以选择
Miniconda
作为
Anaconda
的替代品,
Miniconda
只会安装
Python
解释器环境和⼀些必要的⼯具,其他的三⽅库由⽤户⾃⾏选择安装。其实我个⼈并不喜欢 Anaconda
,因为它是给⼩⽩⽤户使⽤的,我们有了 Python
以后完全可以按照⾃⼰的意愿来安装需要的三⽅库。
conda
命令
如果希望使⽤
conda
⼯具来管理依赖项或者创建项⽬的虚拟环境,可以在终端或命令⾏提示符中使⽤
conda
命令。Windows
⽤户可以在
“
开始菜单
”
中找到
“Anaconda3”
,然后点击
“Anaconda Prompt”
来启动⽀持
conda
的命令⾏提示符。macOS
⽤户建议直接使⽤
“Anaconda-Navigator”
中的
“Environments”
,通过可视化的⽅式对虚拟环境和依赖项进⾏管理。
1.
版本和帮助信息。
查看版本:
conda -V
或
conda --version
获取帮助:
conda -h
或
conda --help
相关信息:
conda list
2.
虚拟环境相关。
显示所有虚拟环境:
conda env list
创建虚拟环境:
conda create --name venv
指定
Python
版本创建虚拟环境:
conda create --name venv python=3.7
指定
Python
版本创建虚拟环境并安装指定依赖项:
conda create --name venv python=3.7 numpy
pandas
通过克隆现有虚拟环境的⽅式创建虚拟环境:
conda create --name venv2 --clone venv
分享虚拟环境并重定向到指定的⽂件中:
conda env export > environment.yml
通过分享的虚拟环境⽂件创建虚拟环境:
conda env create -f environment.yml
激活虚拟环境:
conda activate venv
退出虚拟环境:
conda deactivate
删除虚拟环境:
conda remove --name venv --all
说明
:上⾯的命令中,
venv
和
venv2
是虚拟环境⽂件夹的名字,可以将其替换为⾃⼰喜欢的名字,但是强烈建议
使⽤英⽂且不要出现空格或其他特殊字符。
3.
包(三⽅库或⼯具)管理。
查看已经安装的包:
conda list
搜索指定的包:
conda search matplotlib
安装指定的包:
conda install matplotlib
更新指定的包:
conda update matplotlib
移除指定的包:
conda remove matplotlib
说明
:在搜索、安装和更新软件包时,默认会连接到官⽅⽹站进⾏操作,如果觉得速度不给⼒,可以将默认的官⽅⽹站替换为国内的镜像⽹站,推荐使⽤清华⼤学的开源镜像⽹站。将默认源更换为国内镜像的命令是: conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
和
conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
。如果需要换回默认源,可以使⽤命
令
conda config --remove-key channels
。
使⽤
Notebook
安装和启动
Notebook
如果已经安装了
Anaconda
,
macOS
⽤户可以按照上⾯所说的⽅式在
“Anaconda-Navigator”
中直接启动
“JupyterNotebook”(以下统⼀简称为
Notebook
)。
Windows
⽤户可以在
“
开始菜单
”
中找到
Anaconda
⽂件夹,接下来选择运⾏⽂件夹中的“Jupyter Notebook”
就可以开始数据科学的探索之旅。对于安装了 Python
环境但是没有安装
Anaconda
的⽤户,可以⽤
Python
的包管理⼯具
pip
来安装
jupyter
,然后在终端(Windows
系统为命令⾏提示符)中运⾏
jupyter notebook
命令来启动
Notebook
,如下所示。
安装
Notebook
:
pip install jupyter
安装三⼤神器:
pip install numpy pandas matplotlib
运⾏
Notebook
:
jupyter notebook
Notebook
是基于⽹⻚的⽤于交互计算的应⽤程序,可以⽤于代码开发、⽂档撰写、代码运⾏和结果展示。简单的说,你可以在⽹⻚中直接编写代码
和
运⾏代码
,代码的运⾏结果也会直接在代码块下⽅进⾏展示。如在编写代码的过程中需要编写说明⽂档,可在同⼀个⻚⾯中使⽤ Markdown
格式进⾏编写,⽽且可以直接看到渲染后的效果。
此外,
Notebook
的设计初衷是提供⼀个能够⽀持多种编程语⾔的⼯作环境,⽬前它能够⽀持超过
40
种编程语⾔,包括 Python
、
R
、
Julia
、
Scala
等。
⾸先,我们可以创建⼀个⽤于书写
Python
代码的
Notebook
,如下图所示。
![](https://img-blog.csdnimg.cn/e5a0e6af2d3e4d96b10ebd70b8a65f96.png)
接下来,我们就可以编写代码、撰写⽂档和运⾏程序啦,如下图所示。
Notebook
使⽤技巧
如果使⽤
Python
做⼯程化的项⽬开发,
PyCharm
肯定是最好的选择,它提供了⼀个集成开发环境应该具有的所有功能,尤其是智能提示、代码补全、⾃动纠错这类功能会让开发⼈员感到⾮常舒服。如果使⽤ Python
做数据科学相关的⼯作,Notebook
并不⽐
PyCharm
逊⾊,在数据和图表展示⽅⾯
Notebook
更加优秀。这个⼯具的使⽤⾮常简单,⼤家可以看看 Notebook
菜单栏,相信理解起来不会有太多困难,在知乎上有⼀篇名为
《最详尽使⽤指南:超快上⼿Jupyter Notebook
》
的⽂章,也可以帮助⼤家快速认识
Notebook
。
说明
:
Jupyter
官⽹
上还有⼀个名为
JupyterLab
的⼯具,被称之为
“Next-Generation Notebook”
,⽤户界⾯较之 Notebook
更加友好,有兴趣的读者可以使⽤
pip install jupyterlab
命令来安装这个⼯具,然后通过 jupyter lab
来启动它。
下⾯我为⼤家介绍⼀些
Notebook
的使⽤技巧,希望能够帮助⼤家提升⼯作效率。
1.
⾃动补全。在使⽤
Notebook
编写代码时,按
Tab
键会获得代码提示。
2.
获得帮助。在使⽤
Notebook
时,如果希望了解⼀个对象(如变量、类、函数等)的相关信息或使⽤⽅式,可以在对象后⾯使⽤ ?
并运⾏代码, 窗⼝下⽅会显示出对应的信息,帮助我们了解该对象,如下所示。
![](https://img-blog.csdnimg.cn/a5af8b1bdf394fa6a82947c457e6a565.png)
3. 搜索命名。如果只记得⼀个类或⼀个函数名字的⼀部分,可以使⽤通配符 * 并配合 ? 进⾏搜索,如下所示。
4.
调⽤命令。可以在
Notebook
中使⽤
!
后⾯跟系统命令的⽅式来执⾏系统命令。
5.
魔法指令。
Notebook
中有很多⾮常有趣且有⽤的魔法指令,例如可以使⽤
%timeit
测试语句的执⾏时间,可以使⽤ %pwd
查看当前⼯作⽬录等。如果想查看所有的魔法指令,可以使⽤
%lsmagic
,如果了解魔法指令的⽤法,可以使⽤ %magic
来查看,如下图所示。
![](https://img-blog.csdnimg.cn/a6f2d1a44ba14a499d2c3a17fa68217e.png)
常⽤的魔法指令有:
6.
快捷键。
Notebook
中的很多操作可以通过快捷键来实现,使⽤快捷键可以提升⼯作效率。
Notebook
的快捷键⼜可以分为命令模式下的快捷键和编辑模式下的快捷键,所谓编辑模式就是处于输⼊代码或撰写⽂档状态的模式,在编辑模式下按 Esc
可以回到命令模式,在命令模式下按
Enter
可以进⼊编辑模式。
命令模式下的快捷键:
![](https://img-blog.csdnimg.cn/30ae6ba763d3439aa93ee5a79efafd73.png)
编辑模式下的快捷键:
温馨提示
:如果记不住这些快捷键也没有关系,在命令模式下按
h
键可以打开
Notebook
的帮助系统,⻢上就可以看到快捷键的设置,⽽且可以根据实际的需要重新编辑快捷键,如下图所示。
![](https://img-blog.csdnimg.cn/a035a0dac9c641d6ae85c02cb27e45e6.png)