在机器学习中,我一直本着现有思--》再去做的想法。只有你能想的到,然后才会往结果上走,所以我在这总结一下常用的几个库,然后里面具体用到的可以再去学习(在练习中学习与记忆,比只学习记忆更好。以上纯属个人观点,不喜误吐槽)
1 NumPy快速入门手册:
NumPy(Numerical Python)是Python语言的一个扩充程序库。支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
1) ndarray对象(概念了解):重要的一个特点是其N维数组对象ndarray,它是一系列同类型数据的集合,下标以0开始可以进行索引。
2) 数组创建:1 以numpy中的矩阵模块为ndarray对象创建 2 通过函数创建矩阵(如:ones,zeros)
数组的属性:
3) 基本操作: 1 常用的+,-,*,/,%,** 2 常用的矩阵函数操作如常见的sin、cos,max,std等 3 矩阵的截取(矩阵的截取和list相同,可以通过[](方括号)来截取) 4 矩阵合并(hstack方法和vstack方法)
Numpy与list类型的互相转换
List转numpy.array: temp = np.array(list)
numpy.array转List: arr=temp.tolist()
2 panas快速入门
Pandas是Python的一个数据分析包,容纳了大量库和标准数据模型,也提供大量能使我们快速处理数据的函数和方法,并提供基于numpy字典形式的数据处理方法。
1) Pandas数据结构:series,dataframe
2) pandas数据选择:数据某列,切片,根据条件筛选等选择数据
3) pandas数据清洗:判断是否为空isnull()函数,loc或者iloc设置数据,大小写转换等
4) pandas数据的导入导出格式:读取与存取像csv、excel、json、html、pickle等格式的资料
3 Matplotlib: 一个Python语言的2D绘图库,它支持各种平台,并且功能强大,能够轻易绘制出各种专业的图像(可以在绘制时根据需要进行查找绘制)