pandas练习

最新推荐文章于 2024-07-28 15:01:02 发布

你看这个面

最新推荐文章于 2024-07-28 15:01:02 发布

阅读量672

点赞数

分类专栏： homework

本文链接：https://blog.csdn.net/qq_36183810/article/details/80632412

版权

homework 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

题目地址

https://nbviewer.jupyter.org/github/schmit/cme193-ipython-notebooks-lecture/blob/master/Exercises.ipynb

import random

import numpy as np
import scipy as sp
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# import statsmodels.api as sm
import statsmodels.formula.api as smf

sns.set_context("talk")

anascombe = pd.read_csv('Anscombe.csv')

x = anascombe.groupby('dataset')['x']
y = anascombe.groupby('dataset')['y']
print("x mean:", x.mean())
print("x variance:", x.var())
print("y mean:", y.mean())
print("y variance:", y.var())

print()
print(anascombe[anascombe['dataset'] == 'I'].corr())
print(anascombe[anascombe['dataset'] == 'II'].corr())
print(anascombe[anascombe['dataset'] == 'III'].corr())
print(anascombe[anascombe['dataset'] == 'IV'].corr())
print()

lin_model = smf.ols('y ~ x', anascombe[anascombe['dataset'] == 'I']).fit()
print(lin_model.summary())

lin_model = smf.ols('y ~ x', anascombe[anascombe['dataset'] == 'II']).fit()
print(lin_model.summary())

lin_model = smf.ols('y ~ x', anascombe[anascombe['dataset'] == 'III']).fit()
print(lin_model.summary())

lin_model = smf.ols('y ~ x', anascombe[anascombe['dataset'] == 'IV']).fit()
print(lin_model.summary())


g = sns.FacetGrid(anascombe, col="dataset")
g.map(plt.scatter, "x", "y")
plt.show()