调参技巧

深度学习应用 http://caffecn.cn/?/article/44
                                                </div>
                </div>
                <div class="aw-mod aw-question-detail">
                    <div class="mod-head">
                        <h1>
                            神经网络使用心得--欢迎新手借鉴,老手批评指正                            </h1>

                                                </div>
                    <div class="mod-body">
                        <div class="content markitup-box">
                            我是用Caffe做6分类问题,做一种工业产品的检测。经过反复实验。总结的经验以下几条,供新手参考,也欢迎老手批评指正。大家交流。<br>

 

本文把神经网络的神秘面纱扯下来,新手看了之后,就有了一个完整的认识,知道怎么操作了。当然更基础的东西,要自己学习,掌握。本文仅探讨使用心得,理论方面不包括。

 

个人原创,转载请注明来自本文。


  1. 分辨率,用多大的分辨率。这个取决于目标的特征,如果目标是很大的,例如汽车,房子,在图片中占据很大的比重,那么使用100100甚至5050的分辨率就可以了。但是如果目标很小,例如是蚂蚁,这类的。那不能太小,否则,图形特征太小,网络将无法提取形态特征。造成训练失败。我用150*200兼顾了特征的保存以及最小的图像体积,保证了计算量最小。

    另外,目标就是目标,不要包含太多背景,否则也是浪费计算量。


  2. 网络的选型。使用lenet还是alexnet还是googlenet.看你的问题的规模,如果你的类别不是很多,形态也非常简单,类似于手写数字识别,那么用lenet作为基础,进行调整就可以。如果形态,纹理,都比较复杂,那么lenet受限于特征提取能力,就不合适了,强行使用可能造成网络不收敛。


  3. 网络精简。一般的典型网络,如上述网络,都比较庞大,例如alexnet有5层卷积,2个中间层,能分1000类,googlenet就更多了,有十几个卷积层,交叉组合,也是分1000类。而我们的分类任务可能只要分几类,或者十几类。用人家的网络就会显得杀鸡用牛刀,浪费了计算能力,可能i3 CPU足够的,你得用i7, 也就增加了成本。

    因此要精简网络,说说自己的经验,alexnet5层卷积的输出节点数,96-256-384-384-256,隐含层409614096节点。

    我精简到96-128-128.隐含层只一层,100个节点。分类效果跟精简之前没什么区别。而网络从200多MB降到1MB多,准确度98%, 找到了网络的极限,因为再小的网络,训练无法收敛。可能以后,再增加类别时,需要扩大一下网络。


  4. 样本准备。随机一些,不同方向,不同亮度的,甚至目标的尺寸,大一点小一点,都有。要有足够的代表性。


  5. 可视化,一定要使用Matlab把卷积层的中间结果输出出来,看看那些结果图是有用的,因为同一层很多特征图事重复的,那么就可以减少输出点数,再训练时,网络就不会提取那些没有用或者重复的特征了。

    训练时,学习率0.001. 再缩小也没有什么效果了。


  6. 网络越简单,收敛速度越快,比如我用5层卷积时,要训练到4000轮才开始收敛,而3层时,从1000轮就开始收敛。



    总之在机器学习,多层卷机网络的统一理论的指导下,多多实验吧,你会发现更多的特点,这就是一门实验的学问。

    另外,也推荐一本书,虽然我还没有看,但是很多人推荐,我也下载了。

    Neural Networks:Tricks of the Trade   网络使用技巧,老外写的。

    网上能下载到。



    另外,读一读lecun跟hinton的原始论文也帮助很大。

                                                         </div>
                         <div class="meta clearfix">
                             <div class="aw-article-vote pull-left disabled">
                                 <a href="javascript:;" class="agree" onclick=""><i class="icon icon-agree"></i> <b>5</b></a>
                                                                 </div>
    
                             <span class="pull-right  more-operate">
                                 
                                 
                                 <a class="text-color-999 dropdown-toggle" data-toggle="dropdown">
                                     <i class="icon icon-share"></i> 分享                                    </a>
                                 <div aria-labelledby="dropdownMenu" role="menu" class="aw-dropdown shareout pull-right">
                                     <ul class="aw-dropdown-list">
                                         <li><a onclick="AWS.User.share_out({webid: 'tsina', content: $(this).parents('.aw-question-detail').find('.markitup-box')});"><i class="icon icon-weibo"></i> 微博</a></li>
     									<li><a onclick="AWS.User.share_out({webid: 'qzone', content: $(this).parents('.aw-question-detail')});"><i class="icon icon-qzone"></i> QZONE</a></li>
     									<li><a onclick="AWS.User.share_out({webid: 'weixin', content: $(this).parents('.aw-question-detail')});"><i class="icon icon-wechat"></i> 微信</a></li>
                                     </ul>
                                 </div>
    
                                 <em class="text-color-999">2017-09-05</em>
                             </span>
                         </div>
                     </div>
                     <div class="mod-footer">
                                                     <div class="aw-article-voter">
                                                             <a href="http://caffecn.cn/?/people/caffe" class="voter" data-toggle="tooltip" data-placement="right" data-original-title="caffe"><img alt="caffe" src="http://caffe.caffecn.cn/uploads/avatar/000/00/00/01_avatar_mid.jpg"></a>
                                                             <a href="http://caffecn.cn/?/people/alex68" class="voter" data-toggle="tooltip" data-placement="right" data-original-title="alex68"><img alt="alex68" src="http://caffe.caffecn.cn/uploads/avatar/000/00/00/09_avatar_mid.jpg"></a>
                                                             <a href="http://caffecn.cn/?/people/CatherineW" class="voter" data-toggle="tooltip" data-placement="right" data-original-title="CatherineW"><img alt="CatherineW" src="http://caffe.caffecn.cn/uploads/avatar/000/00/00/07_avatar_mid.jpg"></a>
                                                             <a href="http://caffecn.cn/?/people/moyan" class="voter" data-toggle="tooltip" data-placement="right" data-original-title="moyan"><img alt="moyan" src="http://caffe.caffecn.cn/uploads/avatar/000/00/00/15_avatar_mid.jpg"></a>
                                                             <a href="http://caffecn.cn/?/people/wean25" class="voter" data-toggle="tooltip" data-placement="right" data-original-title="wean25"><img alt="wean25" src="http://caffe.caffecn.cn/uploads/avatar/000/00/51/33_avatar_mid.jpg"></a>
                                                             <!--<a class="more-voters">...</a>-->
                         </div>
                                                 </div>
                 </div>
    
                 <!-- 文章评论 -->
                 <div class="aw-mod">
                     <div class="mod-head common-head">
                         <h2>7 个评论</h2>
                     </div>
    
                     <div class="mod-body aw-feed-list">
                         
                                                             <div class="aw-item" id="answer_list_71">
                                 <div class="mod-head">
                                     <a class="aw-user-img aw-border-radius-5" href="http://caffecn.cn/?/people/c408550969">
                                         <img src="http://caffecn.cn/static/common/avatar-mid-img.png" alt="c408550969">
                                     </a>
                                     <p>
                                         <a href="http://caffecn.cn/?/people/c408550969">c408550969</a>                                        </p>
                                 </div>
                                 <div class="mod-body">
                                     <div class="markitup-box">
                                         感谢楼主分享,但是我有几个问题:<br>
    

1、分几类的任务为什么要用深度学习去做,我们用其他方法也可以实现,并且速度肯定是更快的。

2、i3换i7的钱都足够你买一款低端显卡了,显卡比CPU快了上百倍

3、楼主用的网络都有点老了,现在都用VGG,Resnet,Inception,还有最近的Densenet







很高兴看到你的反馈。因为是图像分类,如果不用深度学习,很难提取目标的特征,因为目标是毛绒玩具,位置不固定,视角不同,很不规则,所以用深度网络。我实在是找不到更好的方法了。

不知道你有什么建议?

由于我们用的是迷你工控,没有插显卡的位置,所以只能…

alexnet速度比较快,在有限的CPU面前,只好用alexnet了。难道VGG,Resnet更快?








写的挺好的!其实每一点都可以展开细细琢磨。比如学习率那一项,一直固定用0.001的学习率并不好,如果网络可以收敛,一开始应该用比较大的学习率,配合batchnorm,有更好的搜索效果。








谢谢。batch norm 是怎么操作的?能否解释一下,呵呵。













不错哦,期待你不断补充~








学习率分情况,用了BatchNorm的话设置成0.1开始,随迭代次数下降就可以了。GoogLeNet的输入是224*224,这是精心设计的一个输入尺寸,如果你缩小成112肯定就不行了,需要把最后的pool跨度从7改到3。再就是小目标检测中,你甚至需要切图才能训练出来。




                                        </div>
                <!-- end 文章评论 -->

                <!-- 回复编辑器 -->
                <div class="aw-mod aw-article-replay-box">
                    <a name="answer_form"></a>
                                            <p align="center">要回复文章请先<a href="http://caffecn.cn/?/account/login/">登录</a>或<a href="http://caffecn.cn/?/account/register/">注册</a></p>
                                        </div>
                <!-- end 回复编辑器 -->
            </div>
            <!-- 侧边栏 -->
            <div class="col-sm-12 col-md-3 aw-side-bar hidden-sm hidden-xs">
                <!-- 发起人 -->
                                    <div class="aw-mod user-detail">
                    <div class="mod-head">
                        <h3>发起人</h3>
                    </div>
                    <div class="mod-body">
                        <dl>
                            <dt class="pull-left aw-border-radius-5">
                                <a href="http://caffecn.cn/?/people/mhaoyang"><img alt="mhaoyang" src="http://caffe.caffecn.cn/uploads/avatar/000/00/48/79_avatar_mid.jpg"></a>
                            </dt>
                            <dd class="pull-left">
                                <a class="aw-user-name" href="http://caffecn.cn/?/people/mhaoyang" data-id="4879">mhaoyang</a>
                                
                                                                    <p>机器视觉算法工程师  电子工程硕士</p>
                            </dd>
                        </dl>
                    </div>
                    <div class="mod-footer clearfix">
                                                    <div class="aw-topic-bar">
                            <div class="topic-bar clearfix">
                                <span class="pull-left text-color-999">
                                    擅长话题 : &nbsp;
                                </span>
                                                                    <span class="topic-tag">
                                    <a href="http://caffecn.cn/?/topic/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E5%BA%94%E7%94%A8" class="text" data-id="3">深度学习应用</a>
                                </span>
                                                                </div>
                        </div>
                                                </div>
                </div>
                                    <!-- end 发起人 -->

                                    <!-- 推荐内容 -->
                <div class="aw-mod">
                    <div class="mod-head">
                        <h3>推荐内容</h3>
                    </div>
                    <div class="mod-body">
                        <ul>
                                                            <li>
                                                                    <a href="http://caffecn.cn/?/question/160">bounding box regression</a>
                                                                </li>
                                                        </ul>
                    </div>
                </div>
                <!-- end 推荐内容 -->
                
                                    <!-- 相关问题 -->
                <div class="aw-mod aw-text-align-justify question-related-list">
                    <div class="mod-head">
                        <h3>相关问题</h3>
                    </div>
                    <div class="mod-body font-size-12">
                        <ul>
                                                            <li><a href="http://caffecn.cn/?/question/887">请问各位大神caffe有没有用于医学图像处理的例子可以供新手学习的?</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/70">可视化神经网络的中间特征,有没有人在做这件事情?</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/101">求助,MFC 下面使用caffe,</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/81">关于训练一层神经网络的问题</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/838">如何使用下载的.model文件</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/1061">请问卷积神经网络中卷积网络和后面的全连接网络的分工是什么?</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/35">double-column的卷积神经网络是怎么进行训练的?Caffe可以实现这种多列的卷积网络吗?</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/212">请问多光谱或高光谱遥感数据能否使用Caffe来训练CNN?</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/864">多标签分类的caffemodel使用</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/1020">使用两个不同的caffemodel初始化网络的不同部分</a></li>
                                                            <li><a href="http://caffecn.cn/?/question/1873">能否直接使用深度学习的特征?</a></li>
                                                        </ul>
                    </div>
                </div>
                <!-- end 相关问题 -->
                                </div>
            <!-- end 侧边栏 -->
        </div>
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值