Python数据分析
第一章 Python数据分析的一般概念
略
第二章 numpy
导入numpy包:import numpy as np
1.Python的list列表可以转为numpy数组:np_lst = np.array([列表], dtype=np.float)
(这里是float类型);
numpy数组中的数据类型有:bool,int,int8,int16,int32,int64,int128,uint8,uint16,uint32,uint64,uint128,float,float16/32/64,complex64/128,string;
若numpy数组中有string类型,则其他数值型也自动转为string;
2.假设numpy数组变量np_lst,则:
np_lst.shape
:数组形状(几行几列)
np_lst.ndim
:数组维数
np_lst.dtype
:元素类型
np_lst.itemsize
:一个元素占多少字节(取决于数据类型)
np_lst.size
:单个元素的总数
则总字节数为np_lst.itemsize * np_lst.size
3.numpy能够创建很多指定数组
(根据上面导入的numpy包)
np.zeros([2,4])
:创建1个2行4列的全0元素二维数组(矩阵);
np.ones([3,5])
:创建1个3行5列的全1元素二维数组(矩阵);
np.random.rand()
:创建一个随机数(默认范围0-1);
np.random.rand(2,4)
:创建1个2行4列的随机数二维数组(矩阵)(默认范围0-1);
np.random.randint(1,10)
:生成1个1-10之间的随机整数(这个必须有参数);
np.random.randint(1,10,3)
:生成3个1-10之间的随机整数(这个必须有参数);
np.random.randn()
:创建1个标准正态分布的随机数;
np.random.randn(2,4)
:创建1个2行4列的标准正态分布的随机数二维数组(矩阵);
np.random.choice([10,20,30])
:创建1个只能从10 20 30这3个数之间的1个数(可以写无数个数作为范围);
np.random.beta(1,10,100)
:创建100个取值范围为1-10之间的随机数,这些随机数服从β分布;
不光是β分布,numpy还可以创建更多其他分布。
(未完)