从数据量角度看待计算机视觉
现有数据集太小—–对象检测—-图像识别—–语音识别—–数据集很大
现有小的数据集意味着需要跟多的手工工程,而有了大数据集就可以使用逻辑简单、体积很大的网络,较少的手工工程。
两种知识来源:
- Labeled data(x,y)标签
- Hand engineered features/network architecture/other components精心找到的特征、设计的网络结构等
计算机视觉领域中,一直没有足够大的数据,所以很多时候需要手工工程,复杂的网络结构和超参数。 当数据集小的时候,考虑迁移学习。
Tips for doing well on benchmark/winning competitions
基准测试:若在基准上做得好就容易发论文,但是一般不会用于生产环境。
基准测试中表现良好的tips:
- 集成ensembing:如果你已经知道了如何构建网络,那么生成不同的几个网络,同事输出结果,并取几个结果的平均值作为最终预测结果,可能可以提高1%-2%,有助于赢得比赛
- Multi-crop at test time:比如10-crop,两张原图像,生成两个镜像,分别取中心crop,左上crop,左下crop等,通过分类器输入这10种图像,结果取平均