一、Numpy类库
1.含义:一个由多维数组对象和用于处理数组的例程集合组成的库
2.数组属性:
arr. shape:数组结构
arr.dtype:数组类型
arr.size:数组元素个数
arr.ndim:数组的维度
3.创建数组三种方法:
①array([[1,2],[3,4]])
② range(start, stop,step)
③arange(start,stop,step)
区别:range()不支持步长为小数,arange()支持步长为小数
4.生成随机数组:
常用:numpy.random.randint(1,5,size=[2,3]) 生成一个在[1,5)区间的2行3列随机数组
5.多维数组的索引:
arr[1,3:5]:第1行的第3,4列
arr[[(1,5),(3,4)]]:arr[1,3]和arr[5,4]
arr[1:,(0,2,3)] :第2行到最后一行的第0,2,3列
6.改变数组形状:arr.reshape(3,4) 将arr数组改为3行4列的数组
7.展开数组:①arr.ravel()#横向展开
②arr.flatten()#横向展开
③arr.flatten(‘F’)#纵向展开
注意:任何数组都变成一维数组
8.转置数组:print("arr.T")
9.
二、pandas读写数据库
1.连接数据库:
2.读取数据库的三种方法:
①读取student表的内容:
②读取school数据库中表的数量,名称等详情:
③读取加查询数据库:
3.读取文件:(若读取其他文件,改为to_*****()方法)
插入:csv:是字符分割文件
读取文本文件:pd.read_table()
读取csv文件:
4.存储csv文件:(若存储excel文件,改为to_excel()方法)