9月份报名做了 2018之江杯全球人工智能大赛 之零样本图像目标识别 的这道题 - 题目链接-https://tianchi.aliyun.com/competition/entrance/231677/introduction
初赛中获得了135名(共3224支队伍参赛),虽没有进入前100名进入决赛,也勉强算是top %5吧。
在此总结一下比赛的收获:
自四月底完成了12306图片验证码的破解以后的几个月,陆续研究了RNN/Yolo之类的算法,
才发现深度学习实在内容太多,多年不学习,要赶上潮流很困难。。
一个偶然的机会发现了阿里云天池 - 2018之江杯全球人工智能大赛 之零样本图像目标识别 的比赛,
刚开始啥叫零样本目标识别都不知道,以为就是普通的图片分类,于是报名。
因为没太理解题目,直接做了个图像分类,提交测试,发现完全不行。于是仔细研究了一下 零样本图像目标识别,重新开始调整算法。
那么图像分类和零样本目标识别有啥不同??
图像分类 - 拿12306火车票图片来说吧,总共80种,比如其中一类为红枣,给你100个红枣的图片,尽管这100个红枣的图片千差万别,但都是红枣,机器就拿这100个样本学习并记住其
特征,比如红色的、椭圆的,表皮有褶皱的等等。 同样,对于另外79种,也一样操作,学习完成了,你给一张图片,给机器识别,机器提取该张图片的特征后,在学习过的80种中间挑出机器认为概率最大的一个。------- 注意,图片分类,机器识别的结果只能是
机器学习过的80种图片中间的一种,如果你给一个80种图片以外的其他图片,机器是无法识别出来的。
零样本图像目标识别 - 与图像分类不同,比如,给你一类猪的图片,100张各种各样的猪,机器学习完成以后,需提取猪的各种特征,如四条腿、大耳朵、2只眼睛,鼻孔很大等等。学习完成以后呢,
给机器一张牛的图片识别,需要机器认出来这是一头牛 --- 注意:牛这个类别机器以前的学习样本中是没有牛这个类别的。这才是本质的区别!!!!!
图像分类算法很简单,就不用提了,那这个零样