sns.regplot
和sns.distplot
这两个图形的使用场景记录。
sns.regplot
用来比较两个变量的关系,是否符合线性回归。一般用来比较特征变量和标签变量上。
sns.distplot
是直方图和核密度图(sns.kdeplot
)的结合。用来看单个连续型变量的分布。
顺便说下直方图和条形图区别:
直方图:先分箱,然后计算每个分箱频数的数据分布。直方图一般用于数字特征(连续型);
条形图一般用于类别特征,条形图有间距,直方图没有。
先用小费数据集画出图形。
# 导入包
import seaborn as sns
from pandas import Series,DataFrame
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
# 拿到小费数据集
tips = sns.load_dataset('tips')
# 数据介绍:total_bill列为消费总金额;tip列为小费金额;sex列为顾客性别;smoker列为顾客是否抽烟;day列为消费的星期;time列为聚餐的时间段;size列为聚餐人数
# 查看前5行数据
tips.head()