python线性拟合模型_Python机器学习-线性回归模型篇

一、What机器学习是什么

机器学习简单来说,是从数据中归纳出有用的规则,它是一种新的编程方式,它不需要人类来总结经验、输入逻辑,人类只需要把大量数据输入计算机,然后计算机就可以自动总结经验归纳逻辑,这个过程叫做训练,训练得到了模型,这个模型可以用来代替人去判断,训练得比较好的模型甚至可以超过人类的判断精准度。(图像识别)

二、一元线性回归一般步骤

❤表达式:y=ax+b,只包含一个自变量和一个因变量,且两者的关系可以用一条直线近似表示,这种回归分析被称为一元线性回归。

步骤实践:

问题:时间为40时的访问量你能预测出来吗?

❤引入python的sklearn机器学习包sklearn这个包是python的机器学习包,LinearRegression是其内的线性回归模型,建立模型前需要先引入该模型

❤初始化模型模型名称加括号即可初始化该模型

❤建立训练集和测试集及数据预处理train_test_split函数能从样本中随机按比例选出测试数据和训练数据,默认是按3:1的比例分割样本训练数据及测试数据,可通过train_size= 参数来自定义分割比例

❤模型训练reshape(-1,1)行参数-1是根据所给的列数自动按照所给的数组的大小形成一个新的数组

❤模型评估-决定系数R平方

※有多少百分比的y波动没有被回归线描述=

误差平方和/总波动

※有多少百分比的y波动被回归线描述=

1-误差平方和/总波动≈决定系数R平方有98.9%的y波动能够被回归线描述出来

❤模型应用

决定系数R平方高达98.9%证明模型已经非常优秀了,可以直接进行应用了,时间为40时通过模型预测浏览量为41.57

三、多元线性回归模型

实例链接: ↓↓↓ 密码:45r0

这是一个200行5列的数据,求分析销售与电视、广播、报纸之间的相关模型https://pan.baidu.com/s/1Y2z120FJK9H6ExxKM3XygA​pan.baidu.com数据情况了解

相关性分析:发现sales跟另外3个变量均有正相关性

❤操作步骤类比一元线性模型

❤模型应用

TV:500 radio:30 newspaper:6时模型预测sales=26.70

四、多项式回归

实践链接:↓↓↓ 密码:4br5https://pan.baidu.com/s/1yxKcdxozDdOvPNmNcQK9zw​pan.baidu.com

y+ax²+bx+c(二次方)

分析问题:以链家的房产数据为例,要求构建远洋山水小区的成交单价随时间的变化模型第一步:导入数据,进行数据预处理第二步:数据预处理(筛选子集、时间序列转换、数据类型转换、数据筛选等操作)第三步:绘制数据,选定模型类型

选定模型为多项式回归模型,开始构建时间与成交单价的多项式模型并评估模型第四步:构建变量time构建的该模型的决定系数R平方得分为57%,证明该模型拟合的情况一般尚有改进的空间构建4次方模型后,决定系数R平方得分较3次方摸性有所提高,得分为61%,照此方法多次试验可最终找到最优拟合多项式

按照实践数据集一步步操作可加深印象,以上是三种比较常用的线性回归模型☺

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值