机器学习15-2(Mini Batch Kmeans)

简介

  • 除了K-Means快速聚类意外,还有两种常用的聚类算法
    • 能够进一步提升快速聚类的速度的 Mini Batch K-Means 算法
    • 能够和K-Means快速聚类形成性能上互补的算法 DBSCAN 密度聚类

Mini Batch K-Means

  • 非常抱歉,需要先来一段理论基础做铺垫,速览即可!
  • 在 K-Means 的基础上增加了一个 Mini Batch 的抽样过程,每轮迭代中心点时,不再代入全部数据、而是代入抽样的Mini Batch进行计算
    • 第一轮先随机选出中心点,一般用 kmeans++ 选 ,更稳
    • 从数据集中随机抽取一些数据(batch_size),把他们分配给最近的质心
    • 根据小批量数据划分情况,更新质心
    • 停止迭代的条件也有所不同
  • 此处可以用梯度下降和小批量(Mini Batch)梯度下降之间的差异进行类比
    • 梯度下降过程中,我们代入全部数据构造损失函数,相当于代入全部数据进行参数的更新,就类似于K-Means 代入每个簇的全部数据进行中心点位置计算
    • 而在小批量梯度下降过程中,我们是借助小批数据构造损失函数并对参数进行更新,就类似于 Mini Batch K-Means 中利用小批数据更新中心点
  • 而 Mini Batch K-Means 的有效性,其实也和小批量梯度下降的有效性类似,那就是对于一组规律连贯的
  • 4
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
机器学习中,batch_size是指每个训练批次中包含的样本数量。在训练神经网络模型时,我们通常将一定数量的样本作为一个批次输入到模型中进行计算和更新参数。batch_size的大小会影响模型参数的更新速度和训练效果。较小的batch_size可以加快参数更新的速度,但可能导致训练过程波动较大;较大的batch_size可以降低噪声干扰,但会使参数更新缓慢和增加内存开销。因此,我们需要根据具体情况选择合适的batch_size,并进行调优以达到最佳的训练效果。在实践中,通常将batch_size设置为2的整数次幂,如32、64、128、256等。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [机器学习中的batch_size是什么?](https://blog.csdn.net/u011699626/article/details/120352398)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [关于机器学习(深度学习)训练过程中 batch_size 的意义](https://blog.csdn.net/quicmous/article/details/130802357)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Roy_Allen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值