Seaborn,pandas,statsmodule的综合使用(高级编程技术 week14)

本文介绍了如何结合Seaborn、pandas和statsmodel进行数据分析,包括计算数据的平均值、方差、相关系数以及线性回归,并展示了如何用Seaborn进行多数据集的可视化。
摘要由CSDN通过智能技术生成

Seaborn,pandas,statsmodule的综合使用(高级编程技术 week14)

这次我们完成的题目来源于该网站:

https://nbviewer.jupyter.org/github/schmit/cme193-ipython-notebooks-lecture/blob/master/Exercises.ipynb

part 1

For each of the four datasets…

  • Compute the mean and variance of both x and y
  • Compute the correlation coefficient between x and y
  • Compute the linear regression line: y=β0+β1x+ϵ (hint: use statsmodels and look at the Statsmodels notebook)

使用到的工具

在计算数据的统计学数据时,我使用到了numpy库相关的函数,如np.average(), np.var()np.corrcoef()等,对statsmodule库也有了初步的了解。

代码展示

data_stats = {}
# 打印四个数据集的相关统计数据,计算并画出四个数据集的拟合曲线
for i in range(0, 4):
    # 获得对应数据集数据
    data = anscombe[anscombe.data == i]
    # 计算平均值,方差,相关系数,并使用json
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值