Anaconda介绍及常用命令总结

Anaconda学习小记

0 Anaconda初见

Anaconda是一个功能强大的数据科学平台。除提供pandas,numpy,matplotlib等强大的数据科学包外,也提供了conda这一简单易用的包与环境管理工具。conda可以实现包的安装与版本管理。更重要的时,借助conda,可以避免"环境搞乱了"的情况。因为conda可以创建虚拟环境environment,从而将不同的python (package)甚至是不同版本的python隔离开而不互相影响。

一些常见的指令如:
conda create -n myEnv python=3.8 创建虚拟环境,环境名为 myEnv
conda activate myEnv 激活/进入myEnv 环境
conda list 列出/查看当前环境的文件
conda install numpy pandas matplotlib 安装指定的包
conda --version 查看conda版本
conda upgrade --all 更新anaconda所有组件
conda env export 导出当前环境的依赖信息
conda env export > myEnv.yaml 导出依赖信息到yaml文件
conda env create -f myEnv.yaml 基于yaml文件创建环境
conda env list 列出当前机器的环境
conda env remove -n ENV_NAME 移除特定环境

1 Anaconda是什么

1.1 Anaconda Distribution是什么

Anaconda是一个用以管理python包和环境的工具,可以帮助用户轻松的进行install,upgrade,uninstall等操作。Anaconda可以创建多个互相隔离的虚拟环境,从而支持不同的开发项目。

conda或Miniconda对数据科学开发和研究具有很大帮助:

  • Anaconda是"一步到位"式的数据科学开发套件,自带强大丰富的数据科学包;
  • 使用conda可以有效管理python包和环境,可以创建多个虚拟环境使得数据科学开发环境更加清晰与易于管理。
    python包即为一系列模组的集合,其中每个功能模组都含有一系列的类与函数定义。安装包后,通过import即可使用python包与各类函数。

1.3 Anaconda与Miniconda

Anaconda在安装时将会安装python,conda,Anaconda Navigator,以及160+数量的python packetes等总计约500MB的内容。如果不需要这么多python packet,则可以选择安装Miniconda。Miniconda只含有python和conda这两个内容。

1.4 conda和pip

conda和pip都是python包(python packet)管理器,可用于安装各种python的包packet等。他们的区别主要在于:

  • pip是python库library的默认包管理器工具。pip除了可以安装python包外,还能安装一些非python包。比如,pip可以安装任何列在PyPI(python packet index)中的包,此时pip的优势就体现出来了。
  • conda则关注于Anaconda生态下的包。conda主要关注于anaconda生态下数据科学包的管理,而pip关注常规用处的python包。比如, anaconda可以管理numpy,scipy,scikit-learn等数据科学包,用以加速各种数学计算。但是anaconda并不是万能的,有时也会需要anaconda生态外的python包,这时候就需要使用pip来安装,管理这些包。

如今,在安装 Anaconda时,会默认同时安装pip和conda。
但也可能出现安装anaconda时未成功安装pip的情况,这时可以按一下方法处理:

  • 查阅pip官方安装说明
  • 通过conda安装pip conda install pip

1.5 环境管理

所谓的python环境一般包含特定版本以下内容:

  • python interpreter 解释器
  • python packet 包
  • utility scripts 实体脚本 诸如pip conda等

在不同的环境中,其python版本,python packe,conda版本,pip版本可能完全不同。一个计算机中,可以同时虚拟地同时存在多个环境,也被称为虚拟环境virtual environment。anaconda中,默认环境称为base(root)。conda可用于创建,管理虚拟环境。除conda以外,也有一些成熟且受欢迎的虚拟环境管理器:virtualenv,pyenv。

虚拟环境可以保证各个项目的开发环境中的python包与虚拟环境彼此以及与默认系统环境相互隔离。在实际的开发环境中,可能用到某些库的不同版本。比如,项目中的部分代码可能使用具有新特性的最新版本numpy,而另一部分代码则可能使用具有已被删除特性的老版本numpy。而在同一个环境中,是不可能同时存在两个版本的不同numpy的。因此,需要为不同版本的numpy各创建一个虚拟环境,并在合适的环境中开发。

用户可以将环境中的包导出为一个清单文件,然后在代码中引用这个清单文件,就可以使用所有环境中已经安装的库。

2 Anaconda安装

安装Anaconda时会默认安装特定版本的Python。很多人可能有类似的疑问:我在
安装Anaconda前已经安装过某一版本的python了,这会有什么影响吗?不用担心,已有python时再安装Anaconda不会有任何影响!但需要注意的是,安装Anaconda后,已有的python脚本和程序都将以Anaconda的python版本去运行,也就是原来的python其实被隔离了!

安装Anaconda后,会默认安装一些内容:

  • Python - 默认会安装最新版本
  • Anaconda Navigatior - 基于GUI的包与环境管理接口
  • Anaconda Prompt - (Windows用户)基于命令行的包与环境管理接口,可以使用conda命令行
    而对于Mac和Linux用户,则可以直接terminal中使用conda命令行 一系列其他应用,诸如Spyder,Jupyter
    Notebook等
  • Spyder - 一个面向科学编程的IDE,自带160+的python科学包
  • Jupyter Notebook则是一个交互式的基于Web的科学编程工具,其环境依赖Anaconda

在安装Anaconda后,可以先运行以下指令以更新包等各种依赖:
conda upgrade conda
conda upgrade --all

注意:严格来讲,只需--all即可,因为这个all已经包括conda。但部分朋友可能出现问题,所以建议同时使用两个命令行来更新anaconda。

3 Anaconda管理python package

3.1 安装package

可以通过conda安装python数据科学包,比如,以下指令用以安装numpy:
conda install numpy

也可同时安装多个包:conda install numpy pandas scipy
也可以指定安装的包的版本:conda install numpy=1.10

令人省心的是,conda在安装包时,可以自动解决包的依赖问题。比如,著名的科学计算包scipy需要numpy作为依赖,在没有事先安装numpy而直接用指令conda install scipy时,conda会自动安装numpy为scipy提供依赖。

3.2 删除package

可以通过conda来删除python包:conda remove PACKAGE_NAME

3.3 更新package

可以通过conda来更新python包:conda update PACKAGE_NAME
也可以一次更新一个环境中的所有包:conda update --all

3.4 搜索package

conda支持根据提供的信息搜索未安装的包以指导安装:
conda search *numpy*
conda search *SEARCH_TERM*

但部分shell可能会在运行搜索指令前拓展通配符*,导致命令失效,可添加引号解决:
conda search '*SEARCH_TERM*'

conda指令参考

conda command reference guide
A comprehensive cheat sheet of Conda 4.6 commands
A comprehensive cheat sheet of Conda version prior to 4.6 commands

4 Anaconda环境管理environment

4.1 创建environment

conda可用于创建虚拟环境以隔离项目,可用以下指令在terminal中创建虚拟环境:
conda create -n ENV_NAME [PYTHON=X.X] [LIST_OF_PACKETS]
其中-n ENV_NAME 指定虚拟环境的名称,-n即指定name,
举例:conda create -n myEnv python=3.8 numpy scipy keras
即创建名为myEnv,采用python3.8版本,带有numpy,scipy,keras库的虚拟环境。

需要注意的是,conda在创建一个初始虚拟环境时,将自动安装数据科学相关的常规标准库,如numpy,scipy,pandas等,除非额外在[LIST_OF_PACKETS]中指定目标库。

4.2 进入与退出environment

  • 针对conda4.6以后版本,Linux/Mac/Windows端:
    conda activate ENV_NAME
  • 针对conda4.6以前版本,Linux/Mac端:
    source activate MY_ENV
  • 针对conda4.6以前版本,Windows端:
    activate MY_ENV

成功进入指定环境后,命令行前端会显示(MY_ENV)~ $
activate改为deactivate,即可退出当前环境返回system环境,即base(root)

4.3 保存,导出与导入environment

anaconda允许创建多个虚拟环境以隔离多个不同环境依赖下项目的开发,同时也提供了一个便利的特性——环境信息的导出,以帮助开发环境的迁移。用以下指令在terminal导出环境依赖信息,包含python和packet的版本号等信息:
conda env export

也可以将依赖信息导出为一个YAML文件,以将环境依赖分享给其他开发者:
conda env export > myEnv.yaml
该YAML文件会默认写入当前的目录。

也可以根据其他人分享的YAML依赖信息文件本地创建新的环境,可用以下指令实现:
conda env create -f myEnv.yaml
该指令将根据指定YAML文件创建具有相同依赖信息的虚拟环境,该环境名称将与指定YAML文件中的虚拟环境名称相同。

对于没使用conda的用户,也可以通过pip实现依赖信息的导出与基于依赖信息的环境建立:
通过以下指令导出环境信息依赖txt文件:
pip freeze > myEnv.txt
通过以下指令根据环境依赖信息文件安装文件中的各种依赖:
pip install -r myEnv.txt

4.4 列出所有environment

有时可能创建了多个环境,以至于忘记了各环境的名称,这时可用以下指令查看当前机器中存在的虚拟环境,以协助环境管理:
conda env list
conda info --envs
运行后将显示虚拟环境的清单,而目前所处的环境将以星号* 标记。其中默认环境名称为base。

4.5 列出environment中的包

  • 如果未进入目标环境:
    conda list -n ENV_NAME
  • 如果已在目标环境:
    conda list
  • 查看目标环境是否有特定包:
    conda list -n ENV_NAME PACKET_NAME

4.6 移除environment

可以移除不再使用的虚拟环境:
conda env remove -n ENV_NAME

4.7 environment参考

Managing virtual environments and packages with pip
Managing virtual environments with conda

5 Anaconda学习总结

本章介绍了以下内容:

  • Anaconda的安装及基本概念
  • Anaconda中通过conda进行python包的管理
  • Anaconda中通过conda进行虚拟环境的管理
    为形成良好的编程习惯,为每一个项目单独创建一个虚拟环境对开发来说至关重要。这一习惯即使对非数据data项目(如Web App)也能十分有效的帮助管理开发环境。

最后,也推荐阅读以下内容以增进对anaconda的了解:

  • 6
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值