数据可视化
可视化是我们以各种可视化形式描述数据的操作,从图表、图形到信息图形。它是探索性数据分析 (EDA) 中最重要的部分之一,因为它使我们能够轻松掌握变量之间的关系以及对后期特征工程和建模有用的数据的任何独特特征。在本文中,我向您介绍了 10 个 Python 可视化概念和技巧,它们鲜为人知,但对于将它们添加到您的可视化库中很有用。
先导入相关的Python库和数据集,示例的数据集包括客户ID,性别,年龄,年收入,消费评估分数。
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
dataFile = pd.read_csv("/home/test.csv")
dataFile.head(10)
使用matplotlib style
Python 中的 Matplotlib 允许我们指定用于可视化的特定样式。这些风格使我们的可视化更容易理解,更容易阅读和解释,有时还为它们增添了审美趣味,使它们对客户更具说服力。以下是可以使用样式列表
['seaborn-deep',
'seaborn-muted',
'bmh',
'seaborn-white',
'dark_background',
'seaborn-notebook',
'seaborn-darkgrid',
'grayscale',
'seaborn-paper',
'seaborn-talk',
'seaborn-bright',
'classic',
'seaborn-colorblind',
'seaborn-ticks',
'ggplot',
'seaborn',
'_classic_test',
'fivethirtyeight',
'seaborn-dark-palette',
'seaborn-dark',
'seaborn-whitegrid',
'seaborn-pastel',
'seaborn-poster']
在开始构建可视化之前,运行你需要的样式的代码,比如使用“fivethirtyeight”
plt.style.use("fivethirtyeight")
设置和更新参数
有时候在制作的每个可视化指定参数很麻烦,如果需要为制作的所有可视化定义一组参数。在这种情况下,可以使用 matplotlib 的 rcParams 方法。
# 使用 matplotlib.pyplot 的 rcParams 方法设置图形大小
plt.rcParams['figure.figsize'] = (16, 9)
# 设置折线图的线宽
import matplotlib as mpl
mpl.rcParams ['lines.linewidth'] = 2
也可以通过 seaborn 的 set 方法设置参数或设置
# 另