Day Five——pandas操作excel
第一部分数据air_data.csv
第二部分数据air_data.csv
第三部分数据zscoredata.xls
第四部分数据zscoredata.xls
第一部分——使用describe观察数据
对应函数programmer_1
步骤:
- 读取数据文件,指定编码格式
encoding='utf-8'
- 对数据的基本描述。
data.describe(percentiles=[], include='all')
,percentiles
表示指定某某分位数 - 计算空值情况。
len(data) - explore['count']
- 提取部分特征保存至新表中
第二部分——使用pandas筛选数据
对应函数programmer_2
步骤:
- 读取数据,提取非空数据
data['SUM_YR_1'].notnull
- 多重条件筛选,得到真值
index1 = data['SUM_YR_1'] != 0