使用Python Seaborn创建热力图：从核心概念到实战案例

最新推荐文章于 2025-03-26 17:44:05 发布

梦想画家

最新推荐文章于 2025-03-26 17:44:05 发布

阅读量1.5k

点赞数 48

分类专栏： # python 文章标签： python 信息可视化

本文链接：https://blog.csdn.net/neweastsun/article/details/146284828

版权

python 专栏收录该内容

253 篇文章

订阅专栏

热力图（Heatmap）作为一种直观的数据可视化工具，通过颜色深浅和渐变映射数据值，广泛应用于数据密度分析、趋势挖掘和跨维度对比。本文将结合Python的seaborn库，从热力图的核心原理到实际操作案例，逐步讲解如何利用热力图揭示数据背后的隐藏规律。无论你是数据分析师、科研人员还是Python爱好者，本文都将为你提供一份清晰实用的热力图制作指南。

一、热力图的核心概念

热力图通过将数值映射到色阶（如蓝→黄→红）或纹理，直观展示二维数据的分布特征。其核心要点如下：

原理
- 数据值 → 色阶映射：数值越大，颜色越暖（如红色）；数值越小，颜色越冷（如蓝色）。
- 适用场景：需同时分析两个分类变量（如行、列）的关系，或地理坐标数据。
典型数据类型
- 矩阵数据：如销售额按“产品类别×地区”交叉统计。
- 时间序列：如用户活跃度随“月份×星期”的变化趋势。
- 空间分布：如人口密度地图（经纬度坐标+人口数）。

二、热力图的常见类型

类型	特点	应用场景举例
矩阵热力图	行列均为分类变量，单元格颜色表示数值	销售渠道对比、用户行为漏斗分析
地理热力图	基于地图坐标，叠加颜色层显示密度或强度	疫情传播路径、外卖订单热力分布
时间序列热力图	横轴为时间，纵轴为分类变量，动态展示趋势	股票市场波动、季节性销售分析
相关性热力图	颜色表示变量间相关性强弱（如皮尔逊系数）	数据特征筛选、基因组学研究

三、Python Seaborn热力图实战

以下通过seaborn库和内置数据集flights（航班乘客量数据），逐步演示热力图创建过程。

1. 数据准备

import seaborn as sns
import matplotlib.pyplot as plt

# 加载数据集
data = sns.load_dataset("flights")

# 数据透视：将"year"和"month"转换为行和列，计算乘客量总和
data_pivot = data.pivot("month", "year", "passengers").fillna(0)

数据结构说明：

行：month（1-12月）
列：year（1949-1960年）
值：passengers（每月乘客总量）

在这里插入图片描述

2. 基础热力图

plt.figure(figsize=(10, 6))
sns.heatmap(data_pivot, annot=True, fmt="d")  # 显示数值标签
plt.title("1949-1960年每月航班乘客量热力图")
plt.show()

输出效果：
在这里插入图片描述

3. 定制化热力图

通过调整参数优化可视化效果：

(1) 调整尺寸与颜色方案

plt.figure(figsize=(14, 8))  # 放大图表
sns.heatmap(data_pivot, cmap="Spectral", vmin=0, vmax=600)  # 使用光谱色系，限定数值范围
plt.title("航班乘客量分布（蓝绿黄红渐变）")

关键参数：

figsize：控制图表整体大小。
cmap：自定义颜色映射（如"hot"、"coolwarm"）。
vmin/vmax：标准化颜色范围，避免极端值干扰。

在这里插入图片描述

(2) 添加注释与颜色条

sns.heatmap(data_pivot, annot=True, fmt="d", cbar=False)  # 关闭颜色条，保留数值标签
plt.title("每月乘客量（无颜色条）")

在这里插入图片描述

4. 高级技巧

分面热力图：对比不同子集数据。

g = sns.FacetGrid(data_pivot.T, col="year", col_wrap=3)  # 按年份分面
g.map(sns.heatmap, data_pivot, annot=True)

动态交互：结合plotly生成交互式热力图。

import plotly.express as px
fig = px.density_heatmap(data, x=“year”, y=“month”, z=“passengers”)
fig.show()



### **四、热力图应用案例**

#### **案例：电商销售渠道分析**

**数据**：某电商平台各渠道（天猫、京东、拼多多）在不同月份的销售额。
**目标**：识别低效渠道和季节性销售趋势。

**实现代码**：

python

```python
# 数据准备（示例）
sales_data = {
  "Channel": ["天猫", "京东", "拼多多"],
  "Jan": [1200, 950, 800],
  "Feb": [1500, 1100, 900],
  # ... 其他月份数据
}
df = pd.DataFrame(sales_data).melt(id_vars="Channel", var_name="Month", value_name="Sales")

# 创建热力图
plt.figure(figsize=(10, 6))
sns.heatmap(df.pivot("Channel", "Month", "Sales"), cmap="Reds")
plt.title("各渠道月度销售额热力图")
plt.show()

解读：