python中seaborn_Python数据可视化：Seaborn（四）：回归分析

最新推荐文章于 2024-06-19 16:12:37 发布

weixin_39597987

最新推荐文章于 2024-06-19 16:12:37 发布

阅读量271

点赞数

文章标签： python中seaborn

在数据分析中，最基础的也是最重要的就是回归分析，即研究一个变量与其他变量的关系。这里我们就来看一下如何进行最基本的回归分析以及其可视化

基础的包引用以及初始化设置import numpy as np

import pandas as pd

import matplotlib as mpl

import matplotlib.pyplot as plt

import seaborn as sns

sns.set(color_codes=True)

np.random.seed(sum(map(ord, "regression")))

tips = sns.load_dataset("tips")

tips数据集的的部分内容total_billtipsexsmokerdaytimesize16.991.01FemaleNoSunDinner2

10.341.66MaleNoSunDinner3

21.013.50MaleNoSunDinner3

23.683.31MaleNoSunDinner2

24.593.61FemaleNoSunDinner4

绘制回归关系

regplot()和lmplot()都可以绘制回归关系,推荐regplot()#必要参数：指定x轴、y轴以及数据集

sns.regplot(x="total_bill", y="tip", data=tips)

sns.lmplot(x="total_bill", y="tip", data=tips);

#分离值不太适合回归分析，孤立、图像重叠

sns.regplot(data=tips,x="size",y="tip")

#x_jitter指定抖动范围，便于回归分析

sns.regplot(x="size", y="tip", data=tips, x_jitter=.05)

上面两个例子是对分立值进行的回归分析，后面我们会看到对于分立的数据，我们如何更好的绘图以表示它们anscombe = sns.load_dataset("anscombe")

#使用anscombe.query("dataset == 'I'")确定数据选取范围

sns.regplot(x="x", y="y", data=anscombe.query("dataset == 'I'"),

ci=None, scatter_kws={"s": 100})

绘制回归函数(直接使用一次函数回归显然不对，下面会使用order来指定回归函数的次数)

这也告诉我们，回归计算不要随意回归带入，而应该先画出图，再根据图像的样子选择特定的回归函数sns.lmplot(x="x", y="y", data=anscombe.query("dataset == 'II'"),

ci=None, scatter_kws={"s": 80})

#order指定回归直线的次数

sns.lmplot(x="x", y="y", data=anscombe.query("dataset == 'II'"),

order=2, ci=None, scatter_kws={"s": 80});

多维度回归#hue增加了一个信息维度

sns.lmplot(x="total_bill", y="tip", hue="smoker", data=tips);

#使用markers切换点的标志物

sns.lmplot(x="total_bill", y="tip", hue="smoker", data=tips,

markers=["o", "x"], palette="Set1");

sns.lmplot(x="total_bill", y="tip", hue="smoker", col="time", data=tips);

sns.lmplot(x="total_bill", y="tip", hue="smoker",

col="time", row="sex", data=tips);

f, ax = plt.subplots(figsize=(5, 5))

sns.regplot(x="total_bill", y="tip", data=tips, ax=ax);

sns.lmplot(x="total_bill", y="tip", col="day", data=tips,

col_wrap=2, height=4);

sns.lmplot(x="total_bill", y="tip", col="day", data=tips,

aspect=.8);

weixin_39597987

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。