斯坦福公开课Machine Learning笔记(八)--Online Learning

最新推荐文章于 2024-09-17 02:13:06 发布

beichao001

最新推荐文章于 2024-09-17 02:13:06 发布

阅读量415

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/beichao001/article/details/52415251

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

斯坦福公开课Machine Learning笔记(八)–Online Learning

这系列笔记其实已经手写好, 现在一次性发上来, 主要是怕丢. 内容以Andrew Ng的讲义为主,主要以公式推导与理解为主,引入和介绍省略.对于最后的Reinforcement Learning部分, 由于没有讲义以及对其实在不熟悉, 就没有笔记了(主要还是因为没有讲义).

现在在线学习用处还是挺广的,尤其是在现在大数据时代,每天都有非常多的数据产生.

与之前的batch learning算法不同的是,batch learning一定要先用训练集训练,在进行预测.但是online learning不一定有训练过程,可以一边预测一边训练,非常适合现在每天都产生很多数据的情况.

以感知器为例:
$h_\theta(x)=g(\theta^Tx)$

$g(z)=\begin{cases}1&z\geq0\\-1& z<0\end{cases}$

和LR类似,其实就是LR的简化版本
在线学习就是每次使用一个样本进行优化
原本的代价函数: $\theta_j:=\theta_j-\alpha(h_\theta(x^{(i)})-y^{(i)})x^{(i)}_j$
而感知器的代价函数: $\theta:=\theta+yx$ 其实就是在错误分类点时,加上或减去x