上班以来,极少读paper,恍然间外面已是深度学习的世界,虽然临毕业那会儿已经知道深度学习大热了,可惜为了毕业很难再转行了~~个人主要是做机器视觉的,特别是图像检索,传统图像检索架构基本是特征提取-编码-池化-ANN检索,我也基本上是做这些领域内的边边角角的工作,深度学习带来的冲击似乎很大,打算花时间学习一下,先从google开源的tensorflow下的im2txt开始,简单记一下笔记~
第一件事情,下载代码&文章&数据库
代码:https://github.com/tensorflow/models.git
文章:https://arxiv.org/abs/1411.4555
数据库:https://mscoco.org(30-40G,特别大)
另外中文tensorflow说明:https://github.com/jikexueyuanwiki/tensorflow-zh
im2txt主要是图文标注系统,视乎是词袋模型+深度学习,打算先看论文~