机器学习算法（一）线性回归

最新推荐文章于 2024-07-25 13:44:24 发布

bowen2006

最新推荐文章于 2024-07-25 13:44:24 发布

阅读量472

点赞数 11

分类专栏：机器学习文章标签：算法机器学习线性回归

本文链接：https://blog.csdn.net/bowen2006/article/details/135335758

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

本文介绍了机器学习中的回归概念，包括线性回归、多元回归和非线性回归方法。通过实例演示如何使用Python的sklearn库进行房屋面积和价格的数据分析，展示了回归模型的建立和预测过程。

摘要由CSDN通过智能技术生成

学习机器学习有一段时间了，为了让自己更好掌握机器学习算法，特做笔记。

回归是分析变量之间的相关关系。当然在计量经济里面，也是通过回归工具找因果关系，只是要排除各种伪因果。在机器学习里面，一般不会考虑因果。

回归可以解决：

1、找到经验公式

2、通过统计推断，判断公式的有效性

3、确定众多的影响因素的主次。

线性回归

一元回归： $Y=a+b X$

多元回归： $Y=\beta _{0}+\beta _{1}X _{1}+\beta _{2}X _{2}+...+\beta _{n}X _{n}$

非线性回归

$Y=a+b e^{-rX}$ 渐近回归

$Y=a+b_{1}X_{1}+b_{2}X^{2}$ 二次型

$Y=z+\frac{b}{X}$ 双曲线型

看看下面简单数据：

房屋面积与房屋价格数据
编号	面积	价格
1	150	6450
2	200	7450
3	250	8450
4	300	9450
5	350	11450
6	400	15450
7	600	18450

假设房屋价格会受房屋面积影响。方程： $Y=a+bX$


import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression as LR

x = np.array([150, 200, 250, 300, 350, 400, 600]).reshape(-1, 1)
y = np.array([6450,7450,8450,9450,11450,15450,18450]).reshape(-1, 1)


# 创建线性回归模型
model = LR()

# 拟合数据
model.fit(x, y)

# 预测新的数据点
x_new = np.array(700).reshape(1, -1)
y_pred = model.predict(x_new)


print('a:',model.intercept_)
print('b',model.coef_)
print(y_pred)

结果：

a: [1771.80851064]
b [[28.77659574]]
[[21915.42553191]]

再画图

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression as LR

x = np.array([150, 200, 250, 300, 350, 400, 600]).reshape(-1, 1)
y = np.array([6450,7450,8450,9450,11450,15450,18450]).reshape(-1, 1)


# 创建线性回归模型
model = LR()

# 拟合数据
model.fit(x, y)

# 预测新的数据点
x_new = np.array(700).reshape(1, -1)
y_pred = model.predict(x_new)


plt.scatter(x,y)
plt.plot(x,model.predict(x),color='red')
plt.show()