Mark 一些有意思的深度学习方向

linolzhang

于 2017-09-08 22:35:56 发布

阅读量5.1k

点赞数 3

分类专栏：深度学习深度学习进阶文章标签：深度学习方向 VQA 深度估计视频解码 AI水军

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linolzhang/article/details/77899735

版权

深度学习同时被 2 个专栏收录

53 篇文章 18 订阅

订阅专栏

深度学习进阶

8 篇文章 35 订阅

订阅专栏

1. VQA

Visual Question Answering，给出一张图片，就该图片提出任何问题？自动get到你所期望的答案。

这属于Visual Reasoning 的范畴，学者们不满足于传统的图像识别、分割、Caption等工作，尝试去挖掘更高级的机器推理能力。

来看解决思路，CNN、LSTM(RNN)、Attention Model、BOW，都是图像、文本、NLP领域的通用手法，没什么新词。

参考一下MIT周博磊同学的 demo（基于BOW+IMG）：

http://visualqa.csail.mit.edu/

2. 单图像目标深度估计

基于单图像的深度做的比较多了，目前基于目标的检测做的工作非常多，如何提取有效景深还是蛮重要的一个话题，目前已经有不少团队在尝试了。

设想基于Mask-RCNN，再添加一个分支，用来做depth。

3. 基于视频流的分析

视频解码的代价太大了，如果在视频不解码的基础上做分析，能解决非常大的计算量，各种嵌入式设备上的应用，有什么办法能够有效的解决这个问题，能解决伐？想想做梦能笑醒！

4. AI水军

最近很火的一个话题，好多5毛党要失业了，这才是刚需啊。

与之相比，摆摊安装caffe、tensorflow啥的真是太low了。

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。