missingno库---缺失值可视化分析

缺失值

当我们拿到数据的时候,数据不一定是完整的,有时候一些特征有缺失值,我们可以通过可视化缺失值来决定我们下一步要进行的操作。

missingno库

missingno是一个可视化缺失值的库,方便使用,我们可以用pip install missingno 即可下载该库。

例子

import missingno as msno
msno.matrix(players.sample(500))#players表示类型为dataframe的表格,sample(500)表示抽取表格中500个样本。

在这里插入图片描述
上图是代码运行后得到的结果,白线越多,代表缺失值越多。
再来验证一下,我们去掉rater1和rate2的缺失值。

players = players[players.rater1.notnull()]
msno.matrix(players.sample(500))

在这里插入图片描述
看得出,rate1的白线没了,因为我们把缺失值给去掉了。所以白线没了。
我们还可以生成热度图。

msno.heatmap(players,figsize=(16, 7))#figsize是指图的大小

在这里插入图片描述
生成了这样一个图,这个图的意思是,比如说rater1和rater2的热度值是1,代表的是,当rater1缺失时,rater2也百分之百缺失,表示的是两个特征之间的关系。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值