导入数据:
相对路径:df = pd.read_csv(execl表格)(’ ./文件名.csv ‘)
绝对路径:df = pd.read_csv(r'地址.csv')
将表头替换为中文:
df = pd.read_csv(’ ./文件名.csv ‘,names = ['' ,'' ,'',''] , header = 0 )
观察前十行:
df.head(10)
观察后十行:
df.tail(10)
删除行或列:
del df['列名称']
将几个列的元素隐藏:
df.drop(['列名称'],axis = 1) (默认axis = 0,是隐藏行元素)
筛选:
df[df['列名称']> 100 ]
保存为csv文件:
df.to_csv('文件名.csv ')
缺失值处理:
df.isnull() 返回布尔值:true or false
df.isnull() .any()含有缺失值的所有列
df.fillna()填充缺失值为....
重复数据:
识别:df.duplicated()
删除重复行:
df.drop_duplicates()