机器学习-线性回归python实践【1】

写在最前面:
线性回归是机器学习最简单的模型,用来寻找最佳拟合曲线。我曾经在数模比赛时用过,虽然只拿了省二。
优点是:易于理解,计算简单
缺点是:对于非线性的数据拟合效果不好
适用数据类型:数值型和标称型数据

今天简单介绍下最小二乘法(ordinary least squares)
在这里插入图片描述
这是一组样例数据的的散点图,目的很简单,得到该组数据的最佳拟合曲线

在这里插入图片描述

第一个函数打开用tab键分隔的文本文件,文件的每一行的最后是目标值。
第二个函数用来计算最佳拟合曲线,首先读x,y的值,并且保存到矩阵中去,然后计算x^T *x ,判断行列式非0,如果此时不判断行列式非0,取逆的时候会有问题。
对了,这是最小二乘法的公式
在这里插入图片描述

目的是求出β,y=x ✖️ β
就是这么简单,只是个入门而已啦,复杂的等我后面研究了再分享
Go on

将数据点升序排列,然后绘制数据集散点图和最佳拟合曲线
在这里插入图片描述
在这里插入图片描述

写在最后:Numpy库提供了相关系数的计算方法corrcoef计算预测值和真实值得相关性:大概是0.98的样子
在这里插入图片描述

今天就到这里,各位晚安。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值