1.查看缺失值 NaN
缺失值一般用NaN表示,先读取数据
import pandas as pd
data = pd.read_excel('数据名称.xlsx')
print(data)
如果查看每一列的缺失值,利用pandas中的info()函数 print(data.info())
这里输出会显示每一行 6 non-null int64 每一行有几个非空值,如果不一样就可以判断少的那一行有缺失值,当然也可以用isnull()将缺失值标记为True
import pandas as pd
data = pd.read_excel('数据名称.xlsx')
a = data.isnull()
print(a)
2.删除缺失值 dropna 注:某一行中有缺失值就会把整行全部删除
import pandas as pd
data = pd.read_excel('数据名称.xlsx')
a = data.dropna()
print(a)
如果只想删除缺失值就需要在dropna(how='all')
3.填充缺失值 filla(填入值)
import pandas as pd
data = pd.read_excel('数据名称.xlsx')
a = data.fillna(2)
print(a)
4.删除重复行 d