机器学习之可视化

有标签问题

关于有标签问题,往往要分析各个数据的组成,其中可能包含连续离散数据。

离散图

对于离散数据,绘制同一数值数据在标签数据下的数量的对比图,如下图所示,可以初步观察出有用的信息。
代码实现如下:

sns.countplot(data, x, y, hue, ax)

data:数据集
x:在x轴显示,指明data哪一列
hue:目标值
ax:轴对象

连续图

对于连续数据,原理同上,只不过绘制的是连续分布图,如下图所示。
在这里插入图片描述代码实现如下:

sns.displot(data, x, hue, kind='kde')

kind:此处为‘kde’,代表图片以连续形状显示

几种有用的图

  1. 相关系数
    在这里插入图片描述

代码实现如下(具体细节见seaborn官网):

# df_corr为连续型数据集的相关系数矩阵
df_corr = df[con_attributes].corr()
mask = np.triu(np.ones_like(df_corr))

sns.heatmap(data=df_corr, mask=mask, annot=True, cmap='YlGnBu')
  1. 相关系数(更多信息)
    在这里插入图片描述

需要将方阵数据转化为(x,y,z)的形式,代码实现如下(具体细节见seaborn官网):

corr_mat = df.corr().stack().reset_index(name="correlation")
g = sns.relplot(
    data=corr_mat,
    x="level_0", y="level_1", hue="correlation",
    size="correlation",
    palette="YlGnBu", hue_norm=(-1, 1),
    height=8, sizes=(30, 300), size_norm=(-.2, .8),
)
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值