1 缺失值产生原因:
有些信息暂时无法获取
有些信息被遗漏或者错误地处理
2 缺失值处理方法
数据补齐
删除缺失行
不处理
3 代码示例
import pandas
data=pandas.read_csv('D:\\DATA\\pycase\\number2\\6.1\\data3.csv')
# 均值'mean' 中值'median' most_frequent 众数
# 调用IMputer方法
from sklearn.preprocessing import Imputer
imputer=Imputer(strategy='mean')
imputer.fit_transform(data[["累计票房"]])