2020.10.22
自学数据分析已经有一段时间了
最近有一个分析中介效应的大作业
刚好复习一下计量知识,以及用python实现简单回归
import numpy as np
from pandas import DataFrame
import pandas as pd #引入数据分析的基础库
xlsx = pd.ExcelFile('C:\\Users\\____\\Desktop\\5018工作表.xlsx')#打开EXCEL保存的文件
frame5018 = pd.read_excel(xlsx,'Sheet1')#读取EXCEL文件中的数据成为一个DF对象
frame5018.head()
frame5018Var = frame5018[['SX','CBZS','DIDI','MAP','COOK','EAT','XXZS','JDBX','WEICHAT']]#取要做相关性检验的变量
frame5018Var.head()
coefficient = frame5018Var.corr(method = 'pearson')#计算相关系数,返回值为相关系数矩阵
import seaborn as sns
import matplotlib.pyplot as plt#做热力图直观反映相关性
coefficient
sns.heatmap(coefficient, cmap='GnBu_r', square=True, annot=True)#做热力图
import scipy.stats as st
import statsmodels.api as sm
from statsmodels.formula.api import ols#引入最小二乘估计所需要的库
lm = ols('SX~ CBZS + WEICHAT + JAN + FEB + MARCH + MAY + JUN + JULY + AUG + SEP + OCT + NOV + DEC ',data=frame5018).fit()
print(lm.summary())#得到回归结果
希望可以每天都能来写一点,记录学习情况,加油。