数据集car_sales共有2694条数据,5个字段,数据集已导入,保存在DataFrame对象data中,字段及说明如下:
列名 类型 说明
Year int64 年份
Month int64 月份
Make object 汽车品牌
Model object 车型
Quantity int64 汽车销量
计算数据集中出现次数最多的车型,保存在变量most_frequence中
用出现次数最多的车型对车型缺失的记录进行填充
正误判定变量:data
导入需要的工具包
import pandas as pd
import numpy as np
读取数据集
data = pd.read_csv(‘car_sales.csv’)
计算出现次数最多的车型
most_frequence = data[‘Model’].value_counts().index[0]
填充车型缺失的记录
data[‘Model’].fillna(0, inplace = True)
验证是否填充
if data[‘Model’].isnull().any() == False:
print(“车型缺失值已填充!”)