在网上查东西无意看到一个关于验证码的小文章,就想了解一下(http://www.doc88.com/p-6374902566548.html),结果发现里面有个观点很好:在深度学习发展的大背景下,图像识别系统有3方面是需要注意或者说存在问题的地方:数据,系统,用户反馈。对于系统我知道的不多,但是在识别中,数据和model在我看来应该对应于三方面中的数据+用户反馈和系统。
数据:Imagenet并不能覆盖现实世界中的所有类别,而且如果有新的类别加入,那标注样本也是极其耗时秏力的。对于 一些任务,甚至需要专家知识,这种情况下,未来发展的趋势是否还是人工标记数据?这一点值得思考。虽然工业 界中有经济基础去标记数据,但是对于每个我们想解决的问题,都去标记貌似也不是长久之计,那怎么得到一些可 用数据来训练CNN或者做其他的识别模型训练呢?迁移学习,是一个可以尝试的方法,但是如果两个任务差距过 大,迁移到的知识可能并不会起到很大的作用。研究者开始试着如何高效自动的创建数据集。
模型(系统):现在深度学习train一个模型的时间相对来说较长,如果让模型能在一个更短的时间训练完成,并且快速 识别是现在研究中的一个热点。(还没有深入了解)
用户反馈:两种形式,一种是收集数据,创建数据集的时候借助用户反馈可以避免噪声保证图像标注的质量,另一方面 识别中吸收用户反馈逐步改善识别系统的覆盖率和准确性(在上覆链接中看到的一点)可能也是值得尝试的。