机器学习笔记——大规模机器学习（large scale machine learning）

最新推荐文章于 2022-12-10 18:23:06 发布

Veropatrinica

最新推荐文章于 2022-12-10 18:23:06 发布

阅读量801

点赞数

分类专栏：机器学习文章标签：机器学习大规模机器学习随机梯度下降在线学习 map-reduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shanwenkang/article/details/85547541

版权

机器学习专栏收录该内容

12 篇文章 2 订阅

订阅专栏

大规模机器学习

大规模机器学习指的是训练样本数量非常大的情况。

随机梯度下降

我们在用梯度下降求解代价函数的最小值时我们每一次迭代都要让所有数据都参与一次运算，因此我们也将其叫做批梯度下降（batch gradient desent），这样带来的运算量将会非常大

为了解决这个问题，我们可以采用随机梯度下降（stochastic）算法，每次θ更新只将一个数据纳入样本计算，这样相当于每次更新迭代只针对某一个数据进行优化，但是对于整体代价函数不见得每次都朝最小值处衍进，而是一个曲折下降的过程，但是最终可以收敛到最小值附近

另外还有处在批梯度下降和随机梯度下降之间的方法叫做迷你批梯度下降（mini-batch gradient descent），它每次采用b个数据来更新θ，这样使得算法收敛可以更加迅速

收敛性

我们可以通过以下的方式检查随机梯度下降算法的收敛性，例如我们每一千个循环计算上一千个数据的代价函数

可以有以下结果，下图三的情况很可能是取点间隔太近了，如果我们每隔5000个数据计算一次代价函数，可能就很很好看到代价函数下降的过程了。而如果代价函数一直是上升的，代表我们的学习速率太大了

为了让算法收敛速度更快，我们还可以根据算法迭代的次数来自动调整学习速率

在线学习

当我们有源源不断的数据时我们可以让算法在线学习新数据的特征，我们每来一个新的数据后用随机梯度下降算法来减小代价函数，之后把这个数据抛弃，等待下一个数据的到来。这样的好处是能够让算法随时学习数据特征的改变

以下是另外一个例子

Map-reduce

除了随机梯度下降算法，我们还可以采用map-reduce技术来加快算法的收敛，map-reduce说到底就是并行计算，把本来一次需要计算的数据（例如400个）分配到四台机器上，这样理论上算法就能加快四倍

另外一些高级优化也能通过map-reduce加速

除了将计算放到多台机器上，我们还可以放到多个CPU核心上来实现并行计算

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记——大规模机器学习（large scale machine learning）

大规模机器学习大规模机器学习指的是训练样本数量非常大的情况。随机梯度下降我们在用梯度下降求解代价函数的最小值时我们每一次迭代都要让所有数据都参与一次运算，因此我们也将其叫做批梯度下降（batch gradient desent），这样带来的运算量将会非常大为了解决这个问题，我们可以采用随机梯度下降（stochastic）算法，每次θ更新只将一个数据纳入样本计算，这样相当于每次更...
复制链接

扫一扫

专栏目录

Veropatrinica CSDN认证博客专家 CSDN认证企业博客

码龄7年

91: 原创

2万+: 周排名

90万+: 总排名

26万+: 访问

: 等级

3349: 积分

2095: 粉丝

217: 获赞

88: 评论

1072: 收藏

私信

关注

热门文章

分类专栏

笔记 1篇
三维重建 1篇
图神经网络 1篇
Unity3D 8篇
Reading Notes 4篇
OJ 32篇
VR 5篇
CUDA 6篇
图像处理 12篇
机器学习 12篇
CNN 14篇
环境配置 2篇
杂 3篇

最新评论

快速理解图神经网络（GCN）
嵩哥迷弟: Out[6]还差一行[2, -2]没写出来
数字图像处理笔记——酉变换（ Unitary image transforms）
Орехов: DFT变换的系数矩阵A应该是正交矩阵，而不是酉矩阵吧，验证代码如下 [code=plain] H = 10; [k, n] = meshgrid(0:H-1); A = exp(-1i*2*pi*u.*x/H); % DFT变换的系数矩阵A E = A * A'; % A*A'的结果是对角矩阵，说明A是正交矩阵 not_E = A * conj(A'); % A*conj(A')的结果不是对角矩阵，说明A不是酉矩阵 [/code]
简单实例理解Unity世界坐标和局部坐标下四元数旋转（四元数乘法）
云上空: 四元数乘法旋转的本质是旋转的连续应用。当你执行p * q时，可以理解为首先应用四元数p的旋转，然后再应用四元数q的旋转。因此transform.rotation=transform.roation*quaterion可以解析如下: transform.rotation表示应用自身的旋转（也可以理解为将物体从默认旋转应用到transform.rotation），然后应用Quaternion旋转（也可以说是向自己施加quaterion旋转，一个意思），因此结果就是绕本地轴旋转了quaternion. 而transform.rotation=Quaternion*transform.rotation; 可以理解为对空间应用Quaternion旋转，对空间进行旋转也就是对空间坐标系的基进行旋转。也就是将整个空间朝某个方向旋转，然后在旋转后的空间中再应用transform.rotaion，因此就是绕世界轴进行了旋转。作为子物体时的四元数旋转：物体的localRotation其实就等于先应用父物体旋转，再应用本地旋转，也就是：transform.rotation = transform.parent.transform.rotation * transform.localRotation。但是我这里不打算通过这个来推断之后的局部旋转和全局旋转的异同关系。因为局部旋转的计算本质上依然是旋转的连续应用。局部坐标时,localRotation=loaclRotation*q和世界坐标的原理一样，也是先应用自身旋转然后应用q的旋转。结果便是绕自身坐标系旋转。而使用transform.localRotation=q*transform.localRotation也和之前一样。还是先对坐标系进行旋转，只不过这里旋转的是局部坐标系，然后再应用自身旋转，也就是自身绕着局部坐标系中的q进行了旋转。和世界坐标中的旋转原理一样，但是坐标系不同，结果自然不同。
Unity开发——Hololens2+Vuforia实现图像识别详细教程
Yxyrwx: 我运行之后不会出现在hololens中不会vuforia菜单，并且模型只会显示在一个浏览框里，不像官方给的例子那种可以在任意角度都能识别出来，这应该咋解决
Unity开发——Hololens2+Vuforia实现图像识别详细教程
东瓶儿: 详细厉害

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。