内容目录
一、初窥数据二、数据清洗三、数据预处理四、数据获取五、数据筛选六、数据汇总七、数据合并八、数据输出
一、初窥数据
我们先说一下DataFrame是什么:
1、DataFrame是一种数据框结构,相当于是一个矩阵形式,单元格可以存放数值、字符串等,这和excel表很像;
2、DataFrame是有 行(index)和 列(columns)可以设置的;
df.shape #查看数据维度
df.info() #查看数据信息
describe() #函数对于数据的快速统计汇总
describe(include = 'all')对每一列数据进行统计,包括计数,均值,std,各个分位数等。
len(df) #查看行数
df.dtypes df['B'].dtype df.B.dtype #查看列的数据类型
df.isnull() df['B'].isnull() df.B.isnull() #空值检查
df['B'].unique() #查看列中的唯一值
df.values #查看数据值
df.columns #查看各列的名称
df.sort_values(by = ['a','b']) #必须指定by参数,即必须指定哪几行或哪几列;无法根据index名和columns名排序
df.sort_index(axis=0) #