1.常用类库介绍
机器学习中我们经常要用到的类库如下:
- NumPy:是Python的一种开源数值计算扩展库,可用来存储和处理大型矩阵,提供了许多高级的数值编程工具, 如矩阵数据类型、矢量处理、精密的运算库,是⼀个运⾏速度⾮常快的数学库,主要⽤于数组计算。
- Pandas: 是⼀个强⼤的基于 NumPy 的分析结构化数据的⼯具集,是为了解决数据分析任务而创建的,⽤于数据挖掘和数据分析,同时也提供数据清洗功能。
- Matplotlib: Python中最著名 2D绘图库,十分适合交互式地进行制图。
- Sklearn:scikit-learn是Python 开发和实践机器学习的著名类库之一,基本功能主要分为六大部分 :分类、回归、聚类、数据降维、模型选择和数据预处理。依赖于类库NumPy ,SciPy 和 matplotlib 运行。
- Keras是一个运行在深度学习框架Tensorflow之上的简单易学的高级Python深度学习库,可以作为Tensorflow的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化。
2.anaconda介绍
- Anaconda 是最流⾏的数据分析平台,全球两千多万⼈在使⽤
- Anaconda 附带了⼀⼤批常⽤数据科学包
- conda
- Python
- 150 多个科学包及其依赖项
- Anaconda 是在 conda(⼀个包管理器和环境管理器)上发展出来的
- Conda可以帮助你在计算机上安装和管理数据分析相关包
- Anaconda的仓库中包含了7000多个数据科学相关的开元库
- Anaconda 包含了虚拟环境管理⼯具
- 通过虚拟环境可以使不同的Python版本环境
- Anaconda 可⽤于多个平台:Windows、Mac OS X 和 Linux