python缺失值可视化

最新推荐文章于 2022-05-27 19:26:44 发布

宇灵梦

最新推荐文章于 2022-05-27 19:26:44 发布

阅读量2.1k

点赞数

文章标签：可视化 python 机器学习

本文链接：https://blog.csdn.net/holal/article/details/106527885

版权

以阿里二手车交易价格预测训练数据为例

#coding:utf-8
#导入warnings包，利用过滤器来实现忽略警告语句。
import warnings
warnings.filterwarnings('ignore')

import pandas as pd
import matplotlib.pyplot as plt
import missingno as msno

## 1) 载入训练集和测试集；
path = 'D:\python_test\二手车价格预测/data/'
Train_data = pd.read_csv(path+'used_car_train_20200313.csv', sep=' ')

# nan可视化
missing = Train_data.isnull().sum()
missing = missing[missing > 0]
missing.sort_values(inplace=True)
missing.plot.bar()
plt.show()
'''
了解哪些列存在 “nan”, 并可以把nan的个数打印，
主要的目的在于 nan存在的个数是否真的很大，如果很小一般选择填充，
如果使用lgb等树模型可以直接空缺，让树自己去优化，
但如果nan存在的过多、可以考虑删掉
'''

# 可视化看下缺省值
'''
白线越多，代表缺失值越多。
'''
msno.matrix(Train_data.sample(250))
plt.show()

msno.bar(Train_data.sample(1000))
plt.show()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

宇灵梦

关注关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
python缺失值可视化

以阿里二手车交易价格预测训练数据为例#coding:utf-8#导入warnings包，利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')import pandas as pdimport matplotlib.pyplot as pltimport missingno as msno## 1) 载入训练集和测试集；path = 'D:\python_test\二手车价格预测/data/'Train_da
复制链接

扫一扫