以前使用spss做数据分析,现在使用sklearn做回归并且计算R方,实验代码如下:
import csv
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
# 读取csv数据到文档中
data = pd.DataFrame.from_csv(u'C:\\Users\\pcdalao\\Desktop\\多元回归.csv')
print(data['商誉'])
print(np.corrcoef(data['商誉'], data['打分结果']))
# 使用线性回归
linreg = LinearRegression()
# 导入数据
model = linreg.fit(data['商誉'].reshape(-1, 1), data['打分结果'])
print(model.coef_, model.intercept_)
# 计算R^2
print(model.score(data['商誉'].reshape(-1, 1), data['打分结果']))
实验结果:
股票代码
601989.SH 4.918816e+01
601607.SH 8.950000e+00
601238.</