业务需求
目前我需要快速搭建一套python的数据统计和科学计算环境,来处理我工作中遇到的大量业务数据,做模拟和验证结论。我需要避免安装过程中的任何失败或包依赖的繁琐,最好几行命令就完事大吉!
下面是我经过调研之后的实操记录,以作备忘。
软硬件环境说明
MacBook Pro 2017款顶配,MacOS 10.13.6,python3版本3.8.5,pip3版本20.1.1
下面是rMBP上的python环境说明
python -V
python3 -V
pip -V
pip3 -V
快速成功安装的诀窍是使用国内镜像源
从国外服务器下载包太慢,我们可以用国内镜像源。
阿里云
http://mirrors.aliyun.com/pypi/simple/
中国科技大学
https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban)
http://pypi.douban.com/simple/
清华大学
https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学
http://pypi.mirrors.ustc.edu.cn/simple/
这里我用豆瓣镜像源来安装所有的python模块,经过实测验证速度飞快!
安装命令
pip3 install numpy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
pip3 install scipy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
pip3 install pandas -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
pip3 install matplotlib -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
继续安装机器学习和深度学习包
pip3 install scikit-learn -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
pip3 install tensorflow -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
这里注意,在安装TensorFlow时,它也依赖特定版本的NumPy和SciPy,我们之前安装的都是较高的版本,在安装TensorFlow时这两个库都被卸载,然后安装上了较低的版本。
在命令行加载模块验证安装是否成功
在命令行依次加载上述已经安装的模块,看看是否加载成功
import numpy
import scipy
import pandas
import matplotlib
import sklearn
import tensorflow
一切看上去很顺利,几分钟就搞定,剩下就是愉快地玩耍了……