一、What机器学习是什么
机器学习简单来说,是从数据中归纳出有用的规则,它是一种新的编程方式,它不需要人类来总结经验、输入逻辑,人类只需要把大量数据输入计算机,然后计算机就可以自动总结经验归纳逻辑,这个过程叫做训练,训练得到了模型,这个模型可以用来代替人去判断,训练得比较好的模型甚至可以超过人类的判断精准度。(图像识别)
二、一元线性回归一般步骤
❤表达式:y=ax+b,只包含一个自变量和一个因变量,且两者的关系可以用一条直线近似表示,这种回归分析被称为一元线性回归。
步骤实践:
问题:时间为40时的访问量你能预测出来吗?
❤引入python的sklearn机器学习包sklearn这个包是python的机器学习包,LinearRegression是其内的线性回归模型,建立模型前需要先引入该模型
❤初始化模型模型名称加括号即可初始化该模型
❤建立训练集和测试集及数据预处理train_test_split函数能从样本中随机按比例选出测试数据和训练数据,默认是按3:1的比例分割样本训练数据及测试数据,可通过train_size= 参数来自定义分割比例
❤模型训练reshape(-1,1)行参数-1是根据所给的列数自动按照所给的数组的大小形成一个新的数组
❤模型评估-决定系数R平方
※有多少百分比的y波动没有被回归线描述=
误差平方和/总波动
※有多少百分比的y波动被回归线描述=
1-误差平方和/总波动≈决定系数R平方有98.9%的y波动能够被回归线描述出来
❤模型应用
决定系数R平方高达98.9%证明模型已经非常优秀了,可以直接进行应用了,时间为40时通过模型预测浏览量为41.57
三、多元线性回归模型
实例链接: ↓↓↓ 密码:45r0
这是一个200行5列的数据,求分析销售与电视、广播、报纸之间的相关模型https://pan.baidu.com/s/1Y2z120FJK9H6ExxKM3XygApan.baidu.com数据情况了解
相关性分析:发现sales跟另外3个变量均有正相关性
❤操作步骤类比一元线性模型
❤模型应用
TV:500 radio:30 newspaper:6时模型预测sales=26.70
四、多项式回归
实践链接:↓↓↓ 密码:4br5https://pan.baidu.com/s/1yxKcdxozDdOvPNmNcQK9zwpan.baidu.com
y+ax²+bx+c(二次方)
分析问题:以链家的房产数据为例,要求构建远洋山水小区的成交单价随时间的变化模型第一步:导入数据,进行数据预处理第二步:数据预处理(筛选子集、时间序列转换、数据类型转换、数据筛选等操作)第三步:绘制数据,选定模型类型
选定模型为多项式回归模型,开始构建时间与成交单价的多项式模型并评估模型第四步:构建变量time构建的该模型的决定系数R平方得分为57%,证明该模型拟合的情况一般尚有改进的空间构建4次方模型后,决定系数R平方得分较3次方摸性有所提高,得分为61%,照此方法多次试验可最终找到最优拟合多项式
按照实践数据集一步步操作可加深印象,以上是三种比较常用的线性回归模型☺