作图篇：python密度图(Density Plot)

最新推荐文章于 2025-03-04 09:00:00 发布

yunxiaoMr

最新推荐文章于 2025-03-04 09:00:00 发布

阅读量4.9w

点赞数 17

分类专栏： Python

本文链接：https://blog.csdn.net/weixin_41297324/article/details/86577728

版权

Python 专栏收录该内容

16 篇文章

订阅专栏

本文探讨了在概率论与统计学习中，如何使用密度图来可视化连续型随机变量的分布。通过一组示例代码，展示了不同缸数车辆的城市里程分布，揭示了X轴与Y轴变量间的关系。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在概率论与统计学习方法中，可视化概率密度就变得非常重要了。这种密度图正是可视化连续型随机变量分布的利器，分布曲线上的每一个点都是概率密度，分布曲线下的每一段面积都是特定情况的概率。如下所示，通过将它们按「response」变量分组，我们可以了解 X 轴和 Y 轴之间的关系。

import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
# 密度图

# Import Data
df = pd.read_csv("https://github.com/selva86/datasets/raw/master/mpg_ggplot2.csv")

# Draw Plot
plt.figure(figsize=(16,10), dpi= 80)
sns.kdeplot(df.loc[df['cyl'] == 4, "cty"], shade=True, color="g", label="Cyl=4", alpha=.7)
sns.kdeplot(df.loc[df['cyl'] == 5, "cty"], shade=True, color="black", label="Cyl=5", alpha=.7)
sns.kdeplot(df.loc[df['cyl'] == 6, "cty"], shade=True, color="dodgerblue", label="Cyl=6", alpha=.7)
sns.kdeplot(df.loc[df['cyl'] == 8, "cty"], shade=True, color="orange", label="Cyl=8", alpha=.7)

# Decoration
plt.title('Density Plot of City Mileage by n_Cylinders', fontsize=22)
plt.legend()
plt.show()