处理丢失数据
由np.nan 填充丢失的数据
df.dropna(axis=0, how='any')
- axis 根据行或者列丢弃,0 是行,1是列
- how,指定丢弃行为
- any,只要有一个nan就丢弃,,默认
- all,所有的都为nan才丢弃
df.fillna(value=0), 为nan填上数据
- value, 指定需要填入的数据
其他相关方法
- df.isnull() 检查dataFrame中是否有缺失数据
- np.any(df.isnull() = True) 针对超大表格,找到是否有nan
Panda导入导出
可以读取的格式
- read_csv 这个常用
- read_excel
- read_hdf
- read_pickle python自带压缩格式
- read_json
可以导出的格式
- to_csv
- to_json
data = pd.read_csv("\*.csv")
read 进来以后会自动加上索引
data.to_csv("***.csv") 直接使用dataframe调用to_*** 来输出
合并多个DataFrame
df1