一、导入
import pandas as pd
二、常用
2.1 读取与保存
2.1.1 读取csv
# 读取现有文件
f = pd.read_csv("./test_2022-11-02_ZhiyanData_white_labeled.csv")
print(f.head(5))
2.1.2 新建df
print(pd.DataFrame({'a':['1'],'b':['2'],'c':['3']}))
dict1 = {"流浪地球":[25,45,65,89],"唐人街探案":(89,56,89,17),"谋杀2":[19,46,49,79]}
df = pd.DataFrame(dict1,index = ["第%d天"%i for i in range(1,5)])
print(df)
2.1.3 保存
df.to_csv("test_ManualData_black_labeled.csv", index=False)
df.to_csv("test_ManualData_black_labeled.csv", index=True)
2.2 插入行列
2.2.1 插入行
df = pd.DataFrame(columns=['a','b','c'])
print(df)
向空的df里插入df2两次:
df = pd.DataFrame(columns=['a','b','c']) # 空dataframe
df2 = pd.DataFrame({'a':['1'],'b':['2'],'c':['3']})
df3 = pd.concat([df,df2,df2],axis=0)
print(df3)
如果插入的行列中部分元素没有值,则会用NaN填充
df = pd.DataFrame(columns=['a','b','c']) # 空dataframe
# df2 = pd.DataFrame({'a':['1'],'b':['2'],'c':['3']})
df2 = pd.DataFrame({'a':['1'],'b':['2']})
df3 = pd.concat([df,df2,df2],axis=0)
print(df3)
2.2.2 插入列
直接赋值即可,这时候插入列的长度需要与之前的长度一致
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print(df)
df['C'] = [7, 8, 9]
print(df)