使用的pandas版本
使用pandas读取数据
import pandas as pd
path = 'D:/Desktop'
data = pd.read_excel(path + 'a.xlsx')
print(data['男smoke'].head())
使用pd.fillna()来处理缺失值(数据是我做过map映射的结果)
使用众数填补缺失值
data['男smoke'].fillna(data['男smoke'].mode(), inplace=True)
你会发现这个函数没有效果,我也去之前的查过一些博客发现语法没有错误。一脸黑人问号?
后来打印了一下data['男smoke'].mode()的数据类型
<class 'pandas.core.series.Series'>
问题就出在这里,我们填补的数据不是数值类型,郁闷了好久
data['男smoke'].fillna(int(data['男smoke'].mode()), inplace=True)
或者你转换成别的数值类型也可以。心累~~~~~~