机器学习（2）自动生成图片描述

最新推荐文章于 2024-03-28 13:00:52 发布

weixin_33804582

最新推荐文章于 2024-03-28 13:00:52 发布

阅读量462

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/yulele/p/4436483.html

版权

近年来很多机器学习研究者开始尝试从图片中挖掘信息，自动生成该图片的描述：

Google Research 在2011年发布正在开发的新技术，声称能侦察图片，再为图片作出文字描述：该新技术结合了计算机视觉技术（computer vision）和自然语言处理（natural language processing），先以卷积神经网络（Convolutional Neural Network，CNN）技术对影像进行分析，提取影像中的信息，再由递归神经网络（Recurrent Neural Network，RNN）产生文字。

这项工作在2010年以后就已经开始有人研究：

第一篇是CMUAbhinav Gupta的CVPR2009的Oral《Understanding Videos, Constructing Plots - Learning a Visually Grounded Storyline Model from Annotated Videos》通过AND-OR的图模型来叙述视频里面正在发生的运动的各个动作。

第二篇是UIUC的Ali Farhadi写的，发在ECCV2010的poster《Every Picture Tells a Story: Generating Sentences for Images》：通过建立图像到已经人工标记的句子的连线，来给图像标注句子。

第三篇是《Corpus-Guided Sentence Generation of Natural Images》，使用语料集增强系统功能，基本处理步骤：

　　（1 ）从图片中提取object

　　（2 ）利用corpus提取出verbs，scenes，prepositions (Syntactic information)

　　（3 ）利用HMM计算最可能出现的object，verb，scene，preposition

　　（4） Generate sentence

开源工具下载：

http://blog.csdn.net/huangxiongbiao/article/details/41820371

Reference:

http://info.xitek.com/news/201411/20-165409.html

http://www.zhizhihu.com/html/y2011/2935.html

转载于:https://www.cnblogs.com/yulele/p/4436483.html

weixin_33804582

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。