Machine Learning线性回归

最新推荐文章于 2024-09-16 21:06:28 发布

v穿袜子的猫

最新推荐文章于 2024-09-16 21:06:28 发布

阅读量554

点赞数

分类专栏：机器学习文章标签：机器学习线性回归梯度下降正规方程

本文链接：https://blog.csdn.net/summerredtea/article/details/45366921

版权

机器学习专栏收录该内容

0 篇文章 0 订阅

订阅专栏

线性回归，是监督性学习的一种方法，分为单变量和多变量两种。

我的理解，就是希望对于目前已有的数据，或曰训练集，由一个函数H来拟合其输入和输出的关系。
这里的函数实际上叫做”hypothesis”，通常是线性的，输入就是”features”，通常用X来表示，输出用Y来表示。
H通常只能拟合Y，而不是完全正确描述X和Y的关系。

函数H具有若干参数 $\theta$ ，我们希望通过一种算法，来自动的选择 $\theta$ 的值，使得函数H在输入为X的时候，输出值能最接近结果Y。
相当于有一个标准来”监督修正”学习的效果，这个标准就是已有的输入X和结果Y，这也就是监督性学习的含义。

线性回归常用的算法有梯度下降和正规方程两种。

梯度下降法

定义一个代价函数 $J(\theta)$ ，该函数代表了函数 $H_\theta(x)$ 拟合数据的误差大小。
当 $H_\theta(x)$ 拟合数据的效果很差时， $J(\theta)$ 的值就会较大。
通过某种方法来改变 $\theta$ ，就可以使得 $H_\theta(x)$ 拟合数据的效果变得更好，表现为 $J(\theta)$ 的值减小。
$J(\theta)$ 的值减小到一定值后会收敛，此时算法结束。

首先来看单变量的线性回归。

1. 单变量

假设训练集中输入为x，输出为y，样本容量为m，并假设 $h_\theta(x)=\theta_0+\theta_1*x$ 。
定义代价函数(Cost Function)为

$J (θ 0, θ 1) = 1 2 m \sum i = 1 m (h θ (x (i)) - y (i)) 2$ $J_{(\theta_0, \theta_1)}=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x^{(i)})-y^{(i)})^2$

$J$ 是关于 $\theta_0$ 和 $\theta_1$ 的二元函数，我们的目标就是求出使得 $J$ 的值最小的 $\theta_0$ 和 $\theta_1$ 。

$J$ 在三维空间中实际上是一个碗形的表面，表面上任意一点的高度即为 $J$ 的值。

站在某一点环顾四周，总会发现有一个方向是”下坡”的方向，并且在该方向下坡最快，将 $\theta_0$ 和 $\theta_1$ 的值不断的往下坡的方向进行修正，就可以使得 $J$ 最终到达”碗底”的最小值，此时就达到了收敛状态。
$J$ 下降最快的方向，实际上就是 $J$ 的梯度，这也就是梯度下降名称的含义。需要注意的是，梯度一个向量而不是一个标量，在该例中，梯度为 $(\theta_0,\theta_1)$ 。

然而，当学习速率 $\alpha$ 太大时，直观的看就是一次迈的步子太大，跳过了最低点，而后面的步子迈得更大，于是就一直在碗上跳来跳去，离碗底越来越远。这样就不会达到收敛状态。
实际编程时，可能要找多次，才能确定一个比较好的学习速率。可以做一个检测，当发现 $J$ 在迭代过程中越来越大时，使得当前学习速率减半，直到 $J$ 的值是越来越小的为止。

另外，对于比较复杂的代价函数， $J$ 可能不止一个最低点，因此梯度下降法容易陷入局部最优解，而达不到全局最优解，此时需要从多个点进行尝试“下坡”，比较每次尝试最终到达的局部最优解，选出局部最优解中的最优解。

迭代公式

repeat until converge{

$\theta_0 = \theta_0-\alpha*\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})$
$\theta_1 = \theta_1-\alpha*\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})*x^{(i)}$

}

出于兴(dan)趣(teng)，我用C语言实现了一遍，很简单就不做注释了。

void sum(double* xset, double* yset, double theta0, double theta1, double* sum0, double* sum1, int m) { *sum0 = 0; *sum1 = 0; double diff; for(int i = 0;i < m;i++){ diff = theta0 + theta1 * xset[i] - yset[i]; *sum0 += diff; *sum1 += diff * xset[i]; } } //不能使用C语言的abs函数 //因为它的参数和返回值都是int #define abs(a,b) ((a)>(b)?((a)-(b)):((b)-(a))) void gradientdescent(double* xset, double* yset, int m, double alpha) { double theta0 = 0, theta1 = 0; double newtheta0 = 1, newtheta1 = 1; double sum0, sum1; int count = 0; //为了防止不收敛时的死循环，可以在这里限制迭代次数 while(abs(newtheta1,theta1) > 0.000001){ theta0 = newtheta0; theta1 = newtheta1; printf("theta: %f %f ", theta0, theta1); sum(xset, yset, theta0, theta1, &sum0, &sum1, m); newtheta0 = theta0 - alpha * sum0; newtheta1 = theta1 - alpha * sum1; printf("new theta: %f %f\n", newtheta0, newtheta1); count++; } printf("theta: %f %f count: %d", theta0, theta1, count); } int main() { double xset[] = {1,2,3,4,5,6,7,8,9,10}; double yset[] = {2.1, 3.9, 5.8, 8, 10, 12.2, 14.1, 16, 18.1, 19.9}; gradientdescent(xset, yset, sizeof(xset)/sizeof(double), 0.005); return 0; }

最后得到的输出为

theta: -0.026007 2.006572 count: 708

其中 2.006572 是斜率，-0.026007 是直线在y轴上的截距

通过Excel计算得到的函数如下图

可以看出两者结果还是相当一致的。

如果使用Octave实现，就比较简单了

function [theta, J_history] = gradientDescent(X, y, theta, alpha, num_iters) m = length(y); % number of training examples J_history = zeros(num_iters, 1); alpha=alpha/m; for iter = 1:num_iters theta1 = theta(1) - alpha * sum(X * theta - y); theta2 = theta(2) - alpha * sum((X * theta - y).*X(:,2)); J_history(iter) = computeCost(X, y, theta); end end

2. 多变量

现实中遇到更多的是多变量的情况，也就对于 $(x_1,x_2,\cdots ,x_n)$ 和输出y，希望找到一个向量 $\theta=[\theta_1,\theta_2,\cdots ,\theta_n]$ ，并令 $H_\theta(x)=\theta_1x_1+\theta_2x_2+\cdots +\theta_nx_n$ ，使用 $H$ 来拟合Y。

仍然定义一个函数 $J(\theta)$ ，表示函数 $H_\theta(x)$ 对于训练集的拟合程度。当拟合程度差时， $J$ 的值较大。
此时 $x$ 从单个值变成了向量，但是 $J$ 的形式变化并不大。

$J (θ) = 1 2 m \sum i = 1 m (h θ (x (i)) - y (i)) 2 = 1 2 m \sum i = 1 m (θ T x - y) 2$ $J_{(\theta)}=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x^{(i)})-y^{(i)})^2=\frac{1}{2m}\sum_{i=1}^{m}(\theta^Tx-y)^2$

从单变量到多变量，代码更加简洁。
代码如下，关键部分只有一行代码。

function [theta] = gradientDescentMulti(X, y, theta, alpha, num_iters) alpha_avg = alpha/length(y); for iter = 1:num_iters theta = theta - alpha_avg * (X' * (X*theta-y)) end end

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

v穿袜子的猫

关注关注

0
点赞

踩

1

收藏

觉得还不错? 一键收藏

0
评论

复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

线性回归c++实现

TITLE

09-12 7923

class CPoint { public: double x; double y; CPoint() { x = 0.0; y = 0.0; } CPoint(double x, double y) { this->x = x; this->y = y; } double getX() { return x; } double getY...

机器学习Machine Learning之线性回归（一）

傲娇刺客123

03-09 420

线性回归——Linear regression利用数理统计中的回归分析来确定两种及以上相互依赖的变量之间的关系。例如：出租房屋价格预测几个概念及表示： m:训练样本数量 n:特征数量 :第i行的所有特征值 :第i行的第j个特征取值大体关系及步骤图：Hypothesis即是我们通过学习算法学得的模型， ...

参与评论您还未登录，请先登录后发表或查看评论

C++元编程——线性回归

Dr_Jack的博客

05-11 311

由于并非平面，所以展现出来的就是最后两个值线性拟合在中间位置。

C++实现线性回归（入门必做）

weixin_45270761的博客

05-30 4344

线性回归原理讲解略或者有空过来补公式。运行结果其中蓝色的点是data.csv中的数据，红色的线就是我们通过线性回归梯度下降法拟合出来的线。 C++实现 #include<bits/stdc++.h> #define ld long double #define pb push_back #define vi vector <int> #define rep(i,a,b) for(int i=a;i<=b;i++) #define per(i,a,b)..

AlgoC++第二课：线性回归

周同学的博客

04-21 1267

Algo C++第二课笔记

C++/Python机器学习—线性回归

seek97的博客

03-27 214

【代码】C++/Python机器学习—线性回归。

机器学习 线性回归

伽音的博客

09-03 330

1.线性回归 1.1原理 线性回归就是通过拟合已知的数据来得到一个线性模型，然后再利用线性模型来预测其他数据，使得预测结果接近真实值，达到预期目标。最后把真实值和预测值作比较，计算均方误差，求取均方误差最小时的一组值。假设函数：损失函数：目标： 1.2算法思路 1.2.1最小二乘法划分数据后，利用训练数据中特征部分构建矩阵X，标签列构建y，然...

Machine Learning Linear Regression-线性回归

12-23

线性回归是机器学习中最基础且重要的算法之一，它用于建立因变量与一个或多个自变量之间的线性关系模型。这个模型可以用来预测连续数值型数据。在本讨论中，我们将深入探讨线性回归的基本概念、最小二乘法以及岭回归...

matlab多元参数非线性回归模型代码-machine_learning_refined:machine_learning_refined

05-21

matlab多元参数非线性回归模型代码完善的机器学习：笔记，练习和Jupyter笔记本在下面，您将找到补充第二版《机器学习精炼》（由剑桥大学出版社出版）的一系列资源。目录小部件样本和我们的教学法我们相信，只有...

[Machine Learning] 线性回归与逻辑回归（含代码）

今天你DEBUG了吗

05-09 585

1.线性回归与逻辑回归的区别与联系 (1)逻辑回归和线性回归首先都是广义的线性回归。 (2)经典线性模型的优化目标函数是最小二乘，而逻辑回归则是似然函数。 (3)线性回归在整个实数域范围内进行预测，敏感度一致，而分类范围，需要在[0,1]。逻辑回归就是一种减小预测范围，将预测值限定为[0,1]间的一种回归模型，因而对于这类问题来说，逻辑回归的鲁棒性比线性回归的要好。或者说，线性回归模型无法做到sigmoid的非线性形式，sigmoid可以轻松处理0/1分类问题。 2.线性回归的代码实现建立线性回归模型

C++实现回归算法(逻辑回归 线性回归)

03-17

C++实现回归算法, 包含线性回归和逻辑回归, 代码干净, 整洁, 有注释, 具有良好的封装性, 可直接迁移使用

二元一次线性回归分析

03-15

简单易用的小程序——不超过550KB——轻松解决二元一次的线性数据拟合问题按照提示输入数据即可迅速得到所求的最优线性方程！

线性回归 c++代码实现

05-05

线性回归 公式 线性回归 公式 线性回归 公式 线性回归 公式

xianxinghuigui.zip_machine learning_机器学习线性

09-22

《机器学习线性回归实战解析》在信息技术领域，机器学习是数据分析的一个重要分支，它致力于让计算机系统通过数据学习并提升性能，而非通过人为编程。线性回归作为机器学习中的基础算法，对于理解整个机器学习框架...

一起对话式学习-机器学习02——机器学习方法三要素

weixin_73074505的博客

09-16 740

机器学习方法=模型+策略+算法可以理解为：机器学习模型在一定优化策略下使用相应求解算法来达到最优化目标。

通过解预测和机器学习促进蚁群优化

最新发布

太极生两鱼

09-16 582

ML - ACO 算法的第一阶段，使用一组已知最优解的小定向越野问题实例训练一个 ML 模型。具体来说，使用分类模型根据问题特定的特征和统计度量来判断一条边是否属于最优路线。然后，训练后的模型用于预测测试问题实例中图中一条边属于最优路线的 “概率”。在第二阶段，我们将 ML 模型预测的概率值纳入 ACO 算法中，即使用概率值作为启发式权重或用于初始化信息素矩阵。这样做的目的是使 ACO 的采样偏向于那些预测更有可能属于最优路线的边，从而有望提高 ACO 找到高质量路线的效率。

车辆检测与分类系统源码分享

xuehaikj的博客

09-13 1321

数据集信息展示在本研究中，我们采用了名为“comexit”的数据集，以支持对YOLOv8模型在车辆检测与分类任务中的改进。该数据集专注于交通工具的识别，特别是公共交通和货运车辆，具有明确的应用背景和实用价值。数据集的类别数量为三，具体包括“bus”（公交车）、“car”（小汽车）和“truck”（卡车）。这三类车辆在城市交通和物流系统中扮演着重要角色，因此，准确的检测与分类对于交通管理、智能交通系统以及自动驾驶技术的发展具有重要意义。

基于机器学习的乳腺癌肿瘤智能分析预测系统

Python极客之家

09-16 801

本系统致力于通过分析肿瘤的各种特征，如半径、纹理、形状等，利用Matplotlib、Seaborn 等工具进行可视化统计分析，并建立机器学习模型来预测肿瘤是否为恶性，测试集预测 AUC 达到 98.441%。系统的设计目的是为了帮助医疗专业人员更快地做出决策，并为患者提供更及时的治疗方案。

机器学习-梯度下降实验一

yangfreeyyds的博客

09-16 163

【代码】机器学习-梯度下降实验一。

Machine Learning实践：Peter Harrington著高清版

通过实例，作者向读者展示了如何使用Python编程语言实现各种机器学习算法，如线性回归、逻辑回归、决策树、随机森林、支持向量机（SVM）、神经网络以及聚类算法等。这些算法是现代数据分析和预测建模中的基石，对于...