python自带的数据结构有:list,tuple,dict,str.加上array模块。
list在保存时,同时保存了指针及对象,这样比较消耗内存。而array对象和列表不同,它直接保存数值,但只是一维的。
numpy包含的数据结构有:ndarray和matrix
ndarray是多元数组,可以是1D,2D,3D...,创建形式是numpy.array()
matrix是矩阵,必须是二维的,且matrix含有ndarray的所有特性,只是运算方式不同。其创建形式是numpy.mat()
可以通过下面的两条命令轻松的实现两者之间的转换:np.asmatrix
和np.asarray
pandas包含的数据结构有:Series和Dataframe
Series是一种类似一维数组的对象,它由一组简单的数据加上其索引组成。
Dataframe是一种表格型的数据结构,它含有一组有序的列,每列可以是不同的数值类型。
1.在几种数据结构转换时,需要用到不同的方法实现。
比如将Series中的数值转换为二元数组时:df['Age'].values.reshape(-1,1);
2.不同的数据结构都可以由相同的元素类型组成。