python缺失值可视化

以阿里二手车交易价格预测训练数据为例

#coding:utf-8
#导入warnings包,利用过滤器来实现忽略警告语句。
import warnings
warnings.filterwarnings('ignore')

import pandas as pd
import matplotlib.pyplot as plt
import missingno as msno

## 1) 载入训练集和测试集;
path = 'D:\python_test\二手车价格预测/data/'
Train_data = pd.read_csv(path+'used_car_train_20200313.csv', sep=' ')

# nan可视化
missing = Train_data.isnull().sum()
missing = missing[missing > 0]
missing.sort_values(inplace=True)
missing.plot.bar()
plt.show()
'''
了解哪些列存在 “nan”, 并可以把nan的个数打印,
主要的目的在于 nan存在的个数是否真的很大,如果很小一般选择填充,
如果使用lgb等树模型可以直接空缺,让树自己去优化,
但如果nan存在的过多、可以考虑删掉
'''

# 可视化看下缺省值
'''
白线越多,代表缺失值越多。
'''
msno.matrix(Train_data.sample(250))
plt.show()

msno.bar(Train_data.sample(1000))
plt.show()

 

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值