文章目录
Anaconda是一个完整的开源的有6百万用户的科学计算包。想要学习R或python来快速进入data science领域,搭建常用科学计算环境首选anaconda。Anaconda支持Linux,Macos和Windows,有1000多个数据处理包可供使用,并且提供了Conda的安装包及环境管理工具。有两种版本Anaconda和Miniconda都支持Conda。选则那个按个人需求来选。
1、Anaconda vs Miniconda:
如上图所示:两者都具有Conda这个包和环境管理工具以及python,差别就是Miniconda只有一些基础的包,而anaconda则还有许多高质量的包,这些包同样可以通过使用conda来为Miniconda安装。所以有以下总结:
1.1、选择Anaconda的原因:
- 使用python 或 conda的新手
- 喜欢一次性把150多个高质量的包全部安装,建一个基本万能的环境
- 有足够大的硬盘空间,不再意安装占用空间
- 不愿意一个一个包的安装
1.2、选择Miniconda的原因:
- 愿意自己按需求来安装
- 硬盘空间有限,省一点算一点
- 想快点安装完,不用大而全,后期可以自己试
综合以上,我个人选择miniconda。
2、Conda介绍
Conda官网上可以看到,它是一个开源的 ”package and environment management system that run on Windows,Mac OS and linux“:
- Conda能快速安装、运行、更新软件包以及它们的依赖包
- Conda能创建、保存、加载、切换各个项目特定的开发环境
- 虽然Conda是为python而创建的,但是Conda可以为任何其它语言比如R,Ruby,Lua,Scala,Java,JavaScript,C,C++,FORTRAN等进行打包及分发。
Conda作为一个安装包和环境管理工具,可能帮助搜索并安装你所需要的包。如果要换python的版本,只需要有conda切换到另一个合适的环境。
2.1、包和环境管理工具介绍:
安装软件比较困难耗时,特别是科学计算的包。常用系统自带安装工具有以下不足:
- 对于特定的研究项目,比较难指定任意自己需要的安装包及版本
- 不能同时在同一个环境中安装不同版本的同一个软件
- 同一个软件,对某一个项目要升级,但升级后另外一个项目不能使用
一个环境,不同项目,需求不同,很难普适。
所以最好的方法就是为每个项目创建各自独立的开发环境
2.1.1、安装包的管理工具
好的安装包管理可以简化安装过程:
- 自动识别软件版本的兼容性,并安装相关依赖项
- 方便处理软件升级
对于linux系统常用的是 ubuntu的apt,CentOS的yum;苹果系统的home brew ;windows没有标准的安装包管理工具。
在科学运算中,对于脚本语言比如python,R,等,有好多第三方包需要管理;pip是python包的默认管理工具;install.packages是R的默认管理包。
2.1.2、环境的管理工具
环境管理工具可以解决许多常见工程师遇到的问题:
- 你的工程需要不同版本的python(R)
- 你的工程中的某些应用未来将不受支持,不能正常工作
- 联合工作,代码共有时,可以在你的机器上工作,但不能在你的伙伴的电脑上工作
环境管理能使用设置特定的开发环境,配套的软件本及相关的依赖包。
- 环境管理工具可以为不同项目创建不同的环境及相关依赖
- 在单个项目中可以找到所有需要软件包并且可复现
- 使用户在没有管理员权限的机器上安装软件
2.2、需要Conda安装包和环境管理工具的原因
在众多的软件包管理工具中,conda 是少有的适用于数据科学研究的工具,它有以下特征:
- conda提供预编译安装包,不需要处理编译器的问题。比如Tensorflow,简单一条命令就可以安装,不用从源码编译。
- conda是跨平台的,支持linux,mac os,windows;同时支持不同的件平台比如x86,power8或power9;支持导出环境配置参数,提供给别人,来实现同样的配置。
- conda支持类似pip的包管理功能
Conda 还提供了数据科学常用的包和工具,比如R,numpy,scipy,matplotlib,keras,pandas,经过优化的tensorflow;还有硬件指定的软件,比如 intel 的MKL, NVIDIA的CUDA。
Anaconda提供数据表明,用conda安装的Tensorflow比pip安装的快8倍。
使用conda安装tensorflow的方法参见博客。
2.3 安装conda
查看conda
which conda
已经安装conda 就会找到安装的绝对路径,没有安装建议安装miniconda,包含了conda和少量的python包,适合自己按需安装自己项目所需的环境。
如果确实想要用完整的安装包:
conda create --name my-anaconda-env anaconda=5.3
所有要安装的包都会列出来,有好多。
确保conda是最新版本:
#更新
conda update -y conda
#验证并查看版本号
conda info
#直接查看版本
conda --version
3、Miniconda安装
官网选择合适版本进行下载,复制链接地址:
wget -c https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh # -c保证断点下载
bash Miniconda3-latest-Linux-x86_64.sh
回车,接接空格,输入yes,接受条例,然后会出现:
有三个选项,通常直接回车完事,以后所有虚拟环境都安装在默认环境,但如是默认环境存储空间有限,可以自己指定路径。
然后一路回车,直到:
输入yes.
关闭shell,安装生效。
生效后,输入:
conda config --set auto_activate_base false
否则,每次登陆,anaconda base都是激活的状态。
安装完成。