将两个数据集的数据分布绘制在一张图上

这是一个Python代码,用于比较两个DataFrame的每一列,并为每一列创建一个直方图。它使用了pandas和matplotlib.pyplot两个Python库。以下是每行代码的解释:

import pandas as pd
import matplotlib.pyplot as plt

导入pandas和matplotlib.pyplot库

fig, axs = plt.subplots(6, 5, figsize=(20, 20))

创建一个5x5的子图布局,将其存储在名为fig的对象中,并将每个子图存储在名为axs的对象中

for i, col in enumerate(data.columns):

遍历data的每一列

ax = axs[i//5, i%5]

选择当前子图,并将其存储在名为ax的对象中

data[col].hist(ax=ax, alpha=0.5, bins=30, label='train')

为df1的当前列创建一个直方图,并将其添加到名为ax的子图中

df[col].hist(ax=ax, alpha=0.5, bins=30, label='test')

为df2的当前列创建一个直方图,并将其添加到名为ax的子图中

ax.set_title(col)

为当前子图添加标题,标题是当前列的名字

ax.legend()

为当前子图添加图例,其中包括“train”和“test”

plt.tight_layout()

调整子图之间的间距以优化布局

plt.show()

显示图形

###### import pandas as pd
import matplotlib.pyplot as plt

# 假设df1和df2是你需要比较的两个DataFrame

fig, axs = plt.subplots(6, 5, figsize=(20, 20))  # 创建一个5x5的子图布局

for i, col in enumerate(data.columns):  # 遍历df1的所有列
    ax = axs[i//5, i%5]  # 选择当前子图
    data[col].hist(ax=ax, alpha=0.5, bins=30, label='train')  # 为df1创建一个直方图
    df[col].hist(ax=ax, alpha=0.5, bins=30, label='test')  # 为df2创建一个直方图

    ax.set_title(col)  # 为当前子图添加标题
    ax.legend()  # 为当前子图添加图例

plt.tight_layout()  # 调整子图之间的间距以优化布局
plt.show()  # 显示图形

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Coder_Xiaopang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值