DataFrame对象的创建
通过字典创建
- 使用包含列表的字典创建DataFrame时,各个列表内元素个数必须一致
- 默认字典的键为dataframe的字段名,不设定索引的时候,自动给出默认索引,从0到len(list)-1
通过二维数组创建
pd.DataFrame(data, index, columns)
data作为值
index作为行索引
columns作为列索引
属性
df.shape查看形状
df.index查看行索引
df.columns查看列名称
方法
df.head()
默认显示5行
df.tail()
默认显示5行
df.info()查看数据的字段的具体信息
df.describe()描述性统计查看
df.set_index(列名)
把该列设置为索引
df.reset_index() 重置索引
df.sort_index()按照索引进行排序
df.sort_values() 按照值进行排序
df.duplicated(subset=[,], keep=‘first’)
df.drop_duplicates(subset=[‘A’,‘B’],keep=‘first’,inplace=True)删除重复行
df.isnull()查看缺失值情况
df.isna()
a = df[df.isna().values]
a.drop_duplicates()