AndrewNG机器学习听课笔记（1 ）——线性回归（linear regression）

最新推荐文章于 2024-04-06 09:41:06 发布

JWMNEU

最新推荐文章于 2024-04-06 09:41:06 发布

阅读量3.6k

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jwmneu/article/details/8185970

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Andrew NG机器学习听课笔记（1）

——线性回归（linear regression）

听课的时候只是觉得这老师讲课听起来真舒服，等差不多的时候，实验室一小子说这货就是大名鼎鼎的coursera的创始人之一NG先生，此时此刻，在自责我自己有眼无珠的同时也暗暗的庆幸，能搜到这样的公开课实属万幸。。

线性回归是一种监督学习的方法，本节主要讲了最小二乘法以及梯度下降法。

为了以后的笔记方便，首先规定下符号的意义：

m ：训练集的容量（即训练样本的个数）

n ：样本的维数

：参数，也叫回归系数

：训练样本

: i =1…m：第i个样本

： j=1…n：样本的第j维

:回归方程

：给定对应的值，也叫target，目标

以后的所有符号都遵从这个记法。

线性回归问题可以简单的描述为给定m个训练样本以及与之对应的target，求得回归方程，使得能够对一个新的样本对应的target 做出相应的预测。

首先定义一个衡量预测的标准：

我们可以用偏差平方和：来表示，当然这个表示方法不唯一，不同的表示方法可能会导致不同的结果，我们会在以后慢慢讨论。

这样的话我们就有了目标：。

这样，线性回归问题就转化为一个优化问题了。怎么使上式取得最小呢？本节课主要介绍了三种方法：

第一种是梯度下降法（gradient descent）

首先从一个初始值开始，重复以下步骤

直到最后的收敛条件。

下面我们求，首先我们针对只有一个样本的情况：

从而上述的更新算法

这是针对一个样本的情况，当有多个样本（m）时更新算法就变成了

上式就是随机梯度下降法最终的更新准则。其中是一个自己设定的参数，叫做学习率，由它控制着梯度下降的速度。

通过上面的描述不难发现一个严重的问题：当样本容量非常大的时候，每更新一个都要把所有的样本跑一遍，这样浪费了大量的时间和空间复杂度，同时当样本足够大的时候，算法是不可行的。

为此提出了一个类似于梯度下降法的优化方法：随机梯度下降法：

算法如下：

For j = 1:m

(对所有的i)

repeat

另外对于最小二乘，大家都知道的一个方法：

，，

则

，从而，对关于求导并让导数等于0，最终就得到了，从而，这是一个非迭代的算法，算是一个解析解吧。

下面讨论针对有不同的表示方法：

下面给出minkowski距离的一个通式：

上式中q取不同的值，会导致我们最终的迭代收敛的位置：当q=1时，算法收敛于中值，当q=2时，算法收敛于均值，当q=0时，算法收敛于众数。

最终还有一个关于收敛终止条件的，有两种方法，第一种是前后两次更新的的差小于某个阈值。但更常用的是前后两次更新后的值的变化。

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JWMNEU CSDN认证博客专家 CSDN认证企业博客

码龄14年

12: 原创

31万+: 周排名

64万+: 总排名

5万+: 访问

: 等级

826: 积分

37: 粉丝

9: 获赞

3: 评论

11: 收藏

私信

关注

热门文章

分类专栏

c++ 11篇
POJ 2篇
排序 1篇
算法 2篇
源代码 1篇
快速排序 1篇
冒泡排序 1篇
归并排序 1篇
选择排序 1篇
希尔排序 1篇
堆排序 1篇
插入排序 1篇
Liunix+C 1篇
GDB 1篇
C 2篇
机器学习 3篇
Caffe源码 1篇

最新评论

GDB基本命令
JWMNEU: http://learn.akae.cn/media/ch19s01.html
C++技能百炼之——运动员排序问题
JWMNEU: [code=cpp] #include <iostream> #include <iomanip> using namespace std; struct sport//声明运动员结构体 { char num[4];//运动员编号 double grade;//运动员成绩 }; void main() { sport a[12] = {{"001",13.6},{"002",14.8},{"010",12.0}, {"011",12.7},{"023",15.6},{"025",13.4}, {"031",14.9},{"036",12.6},{"037",13.4}, {"102",12.5},{"325",15.3},{"438",12.7}};//初始化 sport temp; int i,j; int row = 12,col = 3; ////////////////////////////////////////////////////////////////////////// for (i=0;i<row-1;i++) { int tempIndex=i; temp=a[i]; for (j=i+1;j<row;j++) { if (temp.grade>a[j].grade) { temp=a[j]; tempIndex=j; } } a[tempIndex]=a[i]; a[i]=temp; } ////////////////////////////////////////////////////////////////////////// cout<<setw(6)<<"名次"<<setw(6)<<"编号"<<setw(6)<<"成绩"<<endl; for (i=0;i<row;i++) { cout<<setw(6)<<(i+1)<<setw(6)<<a[i].num<<setw(6)<<a[i].grade<<endl; } cin.get(); } [/code] 选择排序·~
C++技能百炼之——运动员排序问题
JWMNEU: [code=cpp] #include <iostream> #include <iomanip> using namespace std; struct sport//声明运动员结构体 { char num[4];//运动员编号 double grade;//运动员成绩 }; void main() { sport a[12] = {{"001",13.6},{"002",14.8},{"010",12.0}, {"011",12.7},{"023",15.6},{"025",13.4}, {"031",14.9},{"036",12.6},{"037",13.4}, {"102",12.5},{"325",15.3},{"438",12.7}};//初始化 sport temp; int i,j; int row = 12,col = 3; for (i=1;i<row;i++) { temp = a[i]; for (j=i-1;j>=0;j--) { if(a[j].grade<=temp.grade) break; a[j+1]=a[j]; } a[j+1]=temp; } cout<<setw(6)<<"名次"<<setw(6)<<"编号"<<setw(6)<<"成绩"<<endl; for (i=0;i<row;i++) { cout<<setw(6)<<(i+1)<<setw(6)<<a[i].num<<setw(6)<<a[i].grade<<endl; } cin.get(); } [/code] 插入排序~~

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。