深度学习中的样本采样

深度学习是利用一个流形分布上的部分样本(训练样本)训练网络,使网络可以学到流形分布的过程。

训练样本的采集好坏对网络的学习效果影响很大。

我们在整个流形分布上均匀采样获得训练样本,从而可以使网络较好的学习到流形的整体分布。

一般来说,从流形上采样越均匀越好,采样量越大越好。

除此之外,如果我们对流形有一些先验信息的话,通过在流形的高频区域(或细节区域)增加额外采样量,可以使网络有更好的学习效果,学习到的流形分布更准确。


下面是一个示例:

函数表达式:

                 

函数曲面与等高线图:

                     

(1)从函数曲面上均匀采样150个样本点,用以训练一个全连接网络,迭代15000次,学习到的函数曲面和等高线图如下

                    

(2)从函数曲面上均匀采样200个样本点,用以训练一个全连接网络,迭代15000次,学习到的函数曲面和等高线图如下.似乎改善并不是很大。

                      

   (3)从函数曲面上采样200个样本点其中100样本点是均匀采样,另100样本点是在特定区域采样(在流形的峰值区采样),用以训练一个全连接网络,迭代15000次,学习到的函数曲面和等高线图如下.可见,网络的学习效果得到了很大提升。

                                

综上:利用流形分布的先验知识,在流形细节处增加采样数量进入训练集,有助于网络更好的学习流形的分布,学习到的流形分布更准确。

这与我们目前了解的神经网络的性质相符:如果我们想要增强网络对某一类目标的识别能力,那就多增加这一类目标的样本放到训练集中。

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值