python相关性分析的散点图怎么做_Python:matplotlib 和 Seaborn 之散点图和相关性 (三十二)...

散点图

如果我们想研究两个数字变量之间的关系,通常会选择散点图。在散点图中,每个数据点都单独表示为一个点,x 轴对应一个特征值,y 轴对应另一个特征值。创建散点图的一个基本方式是利用 Matplotlib 的 scatter 函数:

plt.scatter(data = df, x = 'num_var1', y = 'num_var2')

可以在这两个变量之间看到一个基本的正向关系,x 轴的值越高,y 轴上的变量值也增大。

替代方法

Seaborn 的 regplot 函数会创建散点图并进行回归函数拟合:

sb.regplot(data = df, x = 'num_var1', y = 'num_var2')

默认情况下,回归函数是线性的,并包含带阴影的回归估计置信区域。在这种情况下,因为看起来像 log(y) ~ x 关系,因此用原始单位绘制回归线不合适。如果我们不关心回归线,那么可以在 regplot 函数调用中设置 reg_fit = False。否则,如果我们想对观察到的数据关系绘制回归线,需要变换数据,如上节课中所述。

def log_trans(x, inverse = False):

if not inverse:

return np.log10(x)

else:

return np.power(10, x)

sb.regplot(df['num_var1'], df['num_var2'].apply(log_trans))

tick_locs = [10, 20, 50, 100, 200, 500]

plt.yticks(log_trans(tick_locs), tick_locs)

注意,x 轴和 y 轴值可以直接设为 Series 或数组,而不是参考 dataframe 中的列。

为者常成,行者常至

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值