What is the Best Multi-Stage Architecture for Object Recognition?(经典文章阅读)

一.文献名字和作者

     What is the Best Multi-Stage Architecture for Object Recognition?, Kevin Jarrett, Koray Kavukcuoglu, Marc’Aurelio Ranzato and Yann LeCun
   

二.阅读时间

    2014年11月3日



三.文献的贡献点

    文章主要是通过实验的方法回答了自己提出的三个问题:1.非线性变换是否影响识别效果;2.使用非监督或者有监督学习到的滤波器是否比随机产生或者人工选择的效果要好;3.级联两个特征提取是否效果比较好。
    通过实验对比,作者对于上面三个问题有了回答:
    1.实验证明,使用非线性能够显著提高识别效果;
    2.使用非监督学习之后再进行监督学习能够获得最好的效果,但是这个最好的效果也仅仅是比单纯使用有监督的效果好一点而已,并不明显;同时,使用有监督和无监督都比使用随机滤波器和人工特征要好;
    3.使用两次特征提取(或者说,层级的特征提取)效果要比单独一次特征提取效果要好,这个也就是深度学习的精髓。
    这篇文章的观点在今天看来,基本上已经是common sense了,再次强调也没有多大意思了。
    因此,这篇文章在今天看来,基本上已经不论算作有创新性的文章了。
    







版权所有,欢迎转载,转载请注明出处,谢谢微笑








  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
bounding box注释是用于多标签物体识别的一种利用方法。在多标签物体识别任务中,我们需要同时识别图像中的多个物体,并为每个物体分配一个或多个标签。bounding box注释是指在图像中标记物体位置的矩形框。 利用bounding box注释进行多标签物体识别可以有以下几个步骤。首先,我们需要一个包含bounding box注释的训练数据集。每个bounding box都与一个或多个物体标签相关联。然后,我们可以使用现有的深度学习模型,如卷积神经网络(CNN),来训练多标签物体识别模型。在训练过程中,我们可以利用bounding box注释来指导模型学习物体的位置和形状信息。 在测试阶段,当我们给一个新的图像输入到训练好的模型中时,模型可以通过预测每个bounding box内是否存在某个物体来实现多标签物体识别。如果一个bounding box内存在某个物体,则将相应的标签分配给该物体。这样,我们可以同时识别图像中的多个物体,并为每个物体分配正确的标签。 bounding box注释对于多标签物体识别任务非常重要。它提供了物体位置和形状的准确信息,有助于模型更好地学习每个物体的特征。通过利用bounding box注释,我们可以训练更准确和可靠的多标签物体识别模型,提高模型的性能和应用的准确性。同时,bounding box注释也可以用于其他与物体位置有关的任务,如目标跟踪和姿态估计等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值