简单线性相关案例-求相关系数

【例子】下面是某广告公司的广告费用与销售收入相关系数计算表

年份广告费用/万元x销售收入/万元y
2001250
2002251
2003352
2004453
2005553
2006654
2007655
2008656
2009756
2010757

n = 数量 = 10

∑x=2+2+3+4+5+6+6+6+7+7=48

∑y=50+51+52+53+53+54+55+56+56+57=537

∑x²=2²+2²+3²+4²+5²+6²+6²+6²+7²+7²=264

∑y²=50²+51²+52²+53²+53²+54²+55²+56²+56²+57²=28885

∑xy=2*50+2*51+3*52+4*53+5*53+6*54+6*55+6*56+7*56+7*57=2616

r=\frac{\sigma _{xy}2 }{\sigma _{x}\cdot \sigma _{y}}= \frac{ \frac{\sum \left ( x-\overset{-}{x} \right ) \left ( y-\overset{-}{y} \right )} {n}} {\frac{\sqrt{\left ( x- \overset{-}{x}\right )^{2}}}{n} \frac{\sqrt{\left ( y- \overset{-}{y}\right )^{2} }}{n}}= \frac{\sum ( x-\overset{-}{x} )( y-\overset{-}{y} ) } {\sqrt{\sum (x-\overset{-}{x})^{2}(y-\overset{-}{y})^{2} }}= \frac{n\sum xy-\sum x \cdot \sum y} { \sqrt{n\sum y^{2}-(\sum y)^{2}} \cdot \sqrt{n\sum y^{2}-(\sum y)^{2}} }

第三个等号右边公式错了,把分母圆点左边的y全部换成x即可,编辑的公式变成了图像无法修改,编辑公式太痛苦了我哭死

代入公式:

先解释一下:相关系数r=xy的协方差/xy的标准差的乘积,协方差就是我们所说的cov xy

相关系数r = \frac{n\sum xy-\sum x \cdot \sum y} { \sqrt{n\sum y^{2}-(\sum y)^{2}} \cdot \sqrt{n\sum y^{2}-(\sum y)^{2}} }

                =\frac{10*2616-48*537} {\sqrt{10*264-48^{2}}*\sqrt{10*28885-537^{2}}}

                =\frac{384}{402.01}

                ≈0.9552

性质:

相关系数相关性
|r|=1完全线性相关
0.8<|r|=1极强相关
0.6<|r|<=0.8强相关
0.4<|r|<=0.6中等程度相关
0.2<|r|<=0.4弱相关
0.0<|r|<=0.2极弱相关
|r|=0完全不相关

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面我将为您介绍一个经典的机器学习案例--波士顿房价预测,使用的是线性回归模型。 首先,我们需要导入相关的库和数据集。可以通过以下代码实现: ```python import numpy as np import pandas as pd from sklearn.datasets import load_boston boston = load_boston() df = pd.DataFrame(boston.data, columns = boston.feature_names) df['Price'] = boston.target ``` 接下来,我们需要对数据集进行预处理和划分,以便于训练和测试模型。可以通过以下代码实现: ```python X = df.iloc[:, :-1].values y = df.iloc[:, -1].values from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0) from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_train = sc.fit_transform(X_train) X_test = sc.transform(X_test) ``` 接着,我们可以使用线性回归模型进行训练和预测。可以通过以下代码实现: ```python from sklearn.linear_model import LinearRegression regressor = LinearRegression() regressor.fit(X_train, y_train) y_pred = regressor.predict(X_test) ``` 最后,我们可以使用评估指标来评价模型的表现。可以通过以下代码实现: ```python from sklearn.metrics import r2_score r2_score(y_test, y_pred) ``` 这里使用了平均绝对误差(MAE)、均方误差(MSE)和决定系数(R2)三个评估指标。常见的评估指标还包括均方根误差(RMSE)和平均绝对百分比误差(MAPE)等。 以上就是一个简单的线性回归案例--波斯顿房价预测的实现过程,希望对您有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值