1、机器学习-Python实践Day1
1.1、机器学习的两个大类
监督学习 --分类和回归
监督学习:在机器学习中提供包含特征和标签的数据,通过机器学习的相关算法实现数据的分类和回归。
分类
分类:标签是离散的数据
回归
回归:标签是连续的数据
无监督学习 --聚类
无监督学习:在机器学习中只提供包含特征的数据,通过相关算法实现数据的聚类。
2.1、机器学习的常用类库
Numpy
Python开源数值计算扩展。用于存储和处理大型矩阵。
Pandas
进行数据处理的最主要类库,提供快速读取、存储、处理数据的函数和方法。
Matplotlib
2D绘图库,提供交互式的制图类库。
scikit-learn
Python中提供算法的类库,主要分为六大部分:分类、回归、聚类、数据降维、模型选择、数据预处理。