[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FuvjOZAc-1667143517280)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/公众号横幅-1.png)]
以下内容是在学习过程中的一些笔记,难免会有错误和纰漏的地方。如果造成任何困扰,很抱歉。
前言
对于连续值的预测,我们常常会说到线性回归模型(当因变量和自变量为线性关系时,它是一种特殊的线性模型),线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛,例如股票预测
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QuDi1HFh-1667143517281)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/机器学习-股票预测示例样图-1.png)]
天气、PM2.5、温湿度预测等
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9ZLWM2ha-1667143517282)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/机器学习-天气预测示例样图-1.png)]
其表达形式为:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-izhvPBpC-1667143517282)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/机器学习入门-线性回归模型公式-2.png)]
b为误差服从均值为0的正态分布,如果只有一个自变量的情况下就叫一元回归
,如果有多个自变量的情况下就叫多元回归
;
以你的工资为例,影响你工资的可能因素有很多:老板赏识、工作努力、运气不错等,如果从一个相对简单的角度去思考,你的工资仅仅由领导的心情决定,通过回归,我们就可以确定领导的心情(自变量:这类变量不依赖于其他任何变量)
与工资(因变量:这类变量依赖于一个或多个自变量)
之间的关系。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SyN8DCSh-1667143517282)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/表情包-最大问题就是来你这里上班-1.png)]
一、简单一元回归
这里我们不引用深度学习框架,通过简单的数学公式完成一元回归案例,首先导入库python
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
生成具有线性关系的随机数据 自变量:area 因变量:price
np.random.seed(0)
area = 2.5 * np.random.randn(100) + 25
price = 25 * area + 5 + np.random.randint(20, 50, size=len(area))
矩阵转换 数据处理
data = np.array([area, price])
data = pd.DataFrame(data=data.T, columns=['area'