6.17学习笔记(缺失值,matplotlib)

无效矩阵的数据密集处理

import pandas as pd
from matplotlib import pyplot as plt
import numpy as np
import missingno as msno
from quilt.data.ResidentMario import missingno_data
null_pattern=(np.random.random(1000).reshape((50,20))>0.5).astype(bool)
null_pattern=pd.DataFrame(null_pattern).replace({False:None})
image=msno.matrix(null_pattern.set_index(pd.period_range('1/1/2011','2/1/2015',freq='M')),freq='BQ')
plt.show()

在这里插入图片描述

missingno条形图,列的无效的简单可视化

from matplotlib import pyplot as plt
import numpy as np
import missingno as msno
from quilt.data.ResidentMario import missingno_data
collisions=missingno_data.nyc_collision_factors()
collisions=collisions.replace("nan",np.nan)
msno.bar(collisions.sample(1000))
plt.show()

在这里插入图片描述
热力图:相关性热图措施无效的相关性,一个变量的存在或不存在如何强烈影响的另一个的存在:msno.heatmap(data)

import pandas as pd
from matplotlib import pyplot as plt
import numpy as np
import missingno as msno
from quilt.data.ResidentMario import missingno_data
collisions=missingno_data.nyc_collision_factors()
collisions=collisions.replace("nan",np.nan)
msno.heatmap(collisions)
plt.show()

在这里插入图片描述
树形图
使用层次聚类算法通过它们的无效性相关性(根据二进制距离测量)将变量彼此相加
在树的每个步骤,基于哪个组合最小化剩余簇的距离来分割变量
变量集越单调,它们的总距离越接近零,并且它们的平均距离(y轴)越接近零。
msno.dendrogram(data)

from matplotlib import pyplot as plt
import numpy as np
import missingno as msno
from quilt.data.ResidentMario import missingno_data
collisions=missingno_data.nyc_collision_factors()
collisions=collisions.replace("nan",np.nan)
msno.dendrogram(collisions)
plt.show()

在这里插入图片描述

破geoplot库安不上,开始云

msno.geoplot(collisions,x='LONGTITUDE,y='LATITUDE',by='ZIP CODE')

在这里插入图片描述

matplotlib数据可视化功能
线图:使用plot()创建带文本标签的线条图
多子图组合图:使用subplot()函数创建多轴(即子图)
突破:使用imshow()函数显示图像
轮廓线和伪彩色:pcolormesh()函数可以对二维数组进行着色表示
contour()函数是表示对此相同数据的另一种方式
直方图:hist()函数自动生成并返回二进制计数或概率
路径:可以使用matplotlib.path模块在Matplotlib中添加任意路径
streamplot:绘制矢量图的流线
三维绘图:mplot3d工具包支持简单的3d图形,包括曲面、线框、散点图和条形图
条形图:bar()
饼图:pie()创建饼图,可自动标记区域的百分比
表:table()函数将文本表添加到坐标轴中
散点图:scatter(),可选大小颜色
填充:fill()
对数图:semilogx(),semilogy()和loglog()
极坐标图:polar()
legend()函数自动生成图例

示例

from matplotlib.pyplot import *
x = [1,2,3,4,5,6]
y = [3,4,6,7,3,2]
#create new figure
figure()
#线
subplot(2,3,1)				\\子图,两行三列第一个
plot(x,y)
#柱状图
subplot(2,3,2)
bar(x,y)
#水平柱状图
subplot(2,3,3)
barh(x,y)
#叠加柱状图
subplot(2,3,4)
bar(x,y)
y1=[2,3,4,5,6,7]
bar(x,y1,bottom=y,color='r')
#前线图
subplot(2,3,5)
boxplot(x)
#散点图
subplot(2,3,6)
scatter(x,y)
show()

在这里插入图片描述

示例

from matplotlib.pyplot import *
figure()
dataset=[1,3,5,7,8,3,4,5,6,7,1,2,34,3,4,4,5,6,3,2,2,3,4,5,6,7,4,3]
subplot(1,2,1)
#箱线图
boxplot(dataset,vert=False)
subplot(1,2,2)
#直方图
hist(dataset)
show()

在这里插入图片描述

正弦余弦及图标

from matplotlib.pyplot import *
import numpy as np
x=np.linspace(-np.pi,np.pi,256,endpoint=True)
y=np.cos(x)
y1=np.sin(x)
plot(x,y)
plot(x,y1)
#图表名称
title("Functions $\sin$ and $\cos$")
#x,y轴坐标范围
xlim(-3.3)
ylim(-1,1)
#坐标上刻度
xticks([-np.pi,-np.pi/2.0,np.pi/2,np.pi],[r'$-\pi$',r'$\pi/2$',r'$0$',r'$+\pi/2$',r'$+\pi$'])
yticks([-1,0,1],[r'$-1$',r'$0$',r'$+1$'])
#网格
grid()
show()

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值