-
DataFrame是最常用的pandas对象,类似表格。完成数据读取后,数据就以DataFrame数据结构存储在内存中。 但此时并不能直接开始统计分析工作,需要使用DataFrame的属性和方法堆数据的大小、分布等基本数据状况有一个了解。 只有对数据基本状况有了一个深度的了解,才能够依据数据的状况,进行量身定制的统计分析。
-
有一些基础属性。如ndim是维度数、dtypes是类型、shape是数据形状(行列数目)等。
-
查看访问DataFrame中的数据:
-
对单列数据的访问:DataFrame的单列数据为一个Series。DataFrame是一个带有标签的二维数组,每个标签相当于每一列的列名。有两种方式实现对单列数据的访问:
(1)以字典访问某一个key的值的方式。使用对应的列名,实现单列数据的访问。
(2)以属性的方式访问,实现单列数据的访问。(不建议使用,易引起混淆) -
对某一列的某几行访问:访问DataFrame中某一列的某几行时,与访问Series的某几行一样。
-
对DataFrame多列的多行数据访问:访问DataFrame多列数据可以将多个列标签视为一个列表; 同时访问DataFrame多列数据中的多行数据和访问单列数据的多行数据方法基本相同。
-
对DataFrame的某几行访问:
(1)与访问DataFrame多列多行相似,只是选择所有列即可,使用“:” 代替列标签。
(2)head和tail也可以得到多行数据,但是用这两种方法得到的数据都是从开始或 者末尾获取的连续数据。默认参数为访问5行,只要在方法的参数中填入访问行数即可实现目标行数的查看。