将两个数据集的数据分布绘制在一张图上

Coder_Xiaopang

已于 2023-06-06 13:27:22 修改

阅读量1k

点赞数

文章标签： python 数据分析数据挖掘

于 2023-06-06 13:26:00 首次发布

本文链接：https://blog.csdn.net/u011390757/article/details/131065705

版权

这是一个Python代码，用于比较两个DataFrame的每一列，并为每一列创建一个直方图。它使用了pandas和matplotlib.pyplot两个Python库。以下是每行代码的解释：

import pandas as pd
import matplotlib.pyplot as plt

导入pandas和matplotlib.pyplot库

fig, axs = plt.subplots(6, 5, figsize=(20, 20))

创建一个5x5的子图布局，将其存储在名为fig的对象中，并将每个子图存储在名为axs的对象中

for i, col in enumerate(data.columns):

遍历data的每一列

ax = axs[i//5, i%5]

选择当前子图，并将其存储在名为ax的对象中

data[col].hist(ax=ax, alpha=0.5, bins=30, label='train')

为df1的当前列创建一个直方图，并将其添加到名为ax的子图中

df[col].hist(ax=ax, alpha=0.5, bins=30, label='test')

为df2的当前列创建一个直方图，并将其添加到名为ax的子图中

ax.set_title(col)

为当前子图添加标题，标题是当前列的名字

ax.legend()

为当前子图添加图例，其中包括“train”和“test”

plt.tight_layout()

调整子图之间的间距以优化布局

plt.show()

显示图形

###### import pandas as pd
import matplotlib.pyplot as plt

# 假设df1和df2是你需要比较的两个DataFrame

fig, axs = plt.subplots(6, 5, figsize=(20, 20))  # 创建一个5x5的子图布局

for i, col in enumerate(data.columns):  # 遍历df1的所有列
    ax = axs[i//5, i%5]  # 选择当前子图
    data[col].hist(ax=ax, alpha=0.5, bins=30, label='train')  # 为df1创建一个直方图
    df[col].hist(ax=ax, alpha=0.5, bins=30, label='test')  # 为df2创建一个直方图

    ax.set_title(col)  # 为当前子图添加标题
    ax.legend()  # 为当前子图添加图例

plt.tight_layout()  # 调整子图之间的间距以优化布局
plt.show()  # 显示图形