由于一些不可知的问题,安装了Ipython虽然成功,然而一些魔法语句的使用出现故障,例如%matplotlib inline语句,这使得Ipython作用不显著,因此本次作业仍然使用简单的python命令行和IDE完成。
本次课程内容主要是围绕pandas库的数据分析展开,并涉及到statsmodels库以及seaborn库。作业中需要依靠这两个库辅助完成线性回归方程的计算以及高级绘图。习题内容主要是分析一个表格文件:https://raw.githubusercontent.com/schmit/cme193-ipython-notebooks-lecture/master/data/anscombe.csv
习题内容是计算表格中某些数据的平均值、方差以及相关系数,然后计算线性回归,以及散点图的绘制。
作答如下:
import random
import numpy as np
import scipy as sp
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
import statsmodels.formula.api as smf
sns.set_context("talk")
anascombe = pd.read_csv('https://raw.githubusercontent.com/schmit/cme193-ipython-notebooks-lecture/master/data/anscombe.csv', error_bad_lines=False)
print(anascombe.head())
mean_x = anascombe['x'].mean()
mean_y = anascombe