计算机视觉现状

从数据量角度看待计算机视觉

现有数据集太小—–对象检测—-图像识别—–语音识别—–数据集很大
现有小的数据集意味着需要跟多的手工工程,而有了大数据集就可以使用逻辑简单、体积很大的网络,较少的手工工程。

两种知识来源:

  • Labeled data(x,y)标签
  • Hand engineered features/network architecture/other components精心找到的特征、设计的网络结构等

计算机视觉领域中,一直没有足够大的数据,所以很多时候需要手工工程,复杂的网络结构和超参数。 当数据集小的时候,考虑迁移学习。

Tips for doing well on benchmark/winning competitions
基准测试:若在基准上做得好就容易发论文,但是一般不会用于生产环境。
基准测试中表现良好的tips:

  • 集成ensembing:如果你已经知道了如何构建网络,那么生成不同的几个网络,同事输出结果,并取几个结果的平均值作为最终预测结果,可能可以提高1%-2%,有助于赢得比赛
  • Multi-crop at test time:比如10-crop,两张原图像,生成两个镜像,分别取中心crop,左上crop,左下crop等,通过分类器输入这10种图像,结果取平均
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值