图像情感识别研究方向

图片情感识别/分类/分析 概述

1.情感分类

当前情感分类上,主要把情感分为两类或者八类:

类别数两分类八分类
详细类别积极消极搞笑兴奋满意尊敬厌恶生气恐惧悲伤

2.图像情感分类方法

图像情感分类方法从特征角度来看,主要可以划分为三个方向,即:基于低端视觉特征的图像情感分类方法、基于语义特征的图像情感分类方法以及基于深度学习的图像情感分类方法。

2.1基于低端视觉特征的图像情感分类

基于低端视觉特征的图像情感分类方法,主要试图使用基础的人工特征来对图像进行情感分类。Wang(2006)通过结合色彩心理学的研究,建立了三个基于亮度、色彩饱和度、色调冷暖等的直方图,并通过支持向量回归的方法,研宄了其与情感之间的联系。Yarmlevskaya(2008)对图像抽取Wiccest特征跟Gabor特征,然后通过支持向量机对图像进行分类。Machajdik(2010)系统地从艺术跟心理学的角度,研究了图像情感与低端特征,例如颜色、纹理、线条组成、图像内容之间的联系。与之前的研究不同,Lu(2012)深入研宄了形状特征,诸如直线特征、曲线特征等对图像情感分类的影响。Wang(2013)从美学角度提取图像的情感特征,但是与之前的工作不同,其更强调特征的可解释性,所有的特征都需要能解释出其与不同情感之间的关系。Zhao(2014)主要探讨了如何通过艺术规则,比如说对称性、轮廓、和谐性等特征,对图像情感加以分类。

2.2基于语义特征的图像情感分类

基于语义特征的图像情感分类方法,主要试图建立图像情感与诸如物体、场景等语义之间的联系。Borth(2013)筛选了1200个形容词名词对,例如美丽的花、可爱的狗等,然后针对这1200个概念,在传统低端特征的基础上建立了一个分类器,因而可以用图像对这1200不同概念的响应,生成一个1200维的情感特征向量,进行图像情感分类。与此同时,Yuan(2013)则是建立一个关于102个场景的分类器,其将图像对102个场景的响应结合人脸特征,作为情感特征,从而进行情感分类。

2.3基于深度学习的图像情感分类

基于深度学习的图像情感分类方法,主要试图通过深度学习的方法,让网络自动学习对情感分类最有帮助的特征,其特征是通过学习而来,而非人工设计。You(2015)设计了一个深度卷积神经网络进行图像情感分类,并且利用反馈的机制,滤除训练集中标注错误的数据,进一步提升了图像情感分类能力。Wang(2016)通过两路网络分别学习形容词性质的描述性词语以及名词性质的物体词语的特征表示,最终将两路特征结合起来用于图像情感分类。

基于深度学习的图像情感分类方法,己经证明了其在图像情感分类上的独特优势,但是仍然有很多方向等待探索。首先,深度网络往往可以提供更具表达力的特征,那实际应用中,应该如何使用深度语义特征进行图像情感分类?此外,不同深度语义特征应该如何融合,以期进一步提升表达效果?这些都是有待进一步探究的问题。其次,虽然深度网络,可以自动学习到对情感分类最好的特征,但是其与传统方法一致,直接从整个图像上提取特征,即将一整幅图像用一个固定维度的向量进行表示,而没有去强调不同图像区域对最终情感分类的不同贡献,通过之前的难点分析可以看出,这也是当前急需解决的问题之一。

3.情感图像检索

情感图像检索主要以图像检索为基础。按照侧重点的不同,主要可以将其划分为两类,即基于特征表示的图像检索方法以及基于哈希的图像检索方法。基于特征表示的图像检索方法,按照特征抽取方式的不同又可以将其划分为两大类,即基于人工特征的图像检索方法以及基于深度特征的图像检索方法。

3.1基于人工特征的图像检索方法

基于人工特征的图像检索方法主要试图借助相关知识来人工设计特征,以期建立最基础的图像像素与高级语义之间的联系。在过去的几十年中,大量的全局特征以及局部特征被设计提出,用于一系列计算机视觉相关的任务之中(Loweetal,1999:Yangetal,2007;Wuetal,2011)。当然,其中也包括图像检索领域。Jain(1996)尝试使用颜色与边缘特征,进行图像检索。Manjunath(1996)则尝试建立纹理特征与图像检索之间的联系。Oliva(2001)提出GIST特征描述子,并用其抽取图像特征,然后用于图像检索之中。之后,Wu(2011)设计了CEN-TRIST'特征,并将其应用于场景图像检索之中。所有上述提及的方法,都是基于全局特征的图像检索方法,下面来介绍几种基于局部特征的图像检索方法。SIFT和SURF是常见的图像局部特征描述子(Lowe etal,1999;Bayetal,2006),Wu(2011)在这些局部特征的基础上,通过词袋模型对局部特征描述子进行量化,生成图像最终的特征表示,从而再将其应用到图像检索之中。Yu(2013)与Wu(2011)的工作类似,也是将词袋模型与局部特征描述子相结合,用于图像检索。所有上述工作,都推动了图像检索的早期研宄。

3.2基于深度特征的图像检索方法

基于深度特征的图像检索方法,主要在特征的抽取上,用深度网络某一层的输出作为最终的特征表示。通常而言,对于图像以及视频等相关问题,研究人员更多利用卷积神经网络,获取最终的图像特征表示。Donahue(2014)首先验证了以深度卷积神经网络中全连接层输出作为特征在众多计算机视觉相关问题中的普适性。Wan(2014)则证实了深度卷积神经网络中全连接层深度特征在图像检索领域的突出表现。Babenko(2015)在深度卷积神经网络中卷积层特征的基础上,通过求和池化的方式,获取最终的特征表达,然后将其用于图像检索中。此外,Gordo(2016)通过合并众多不同候选区域的卷积层特征描述子,最终得到固定维度的图像特征表示用于图像检索之中。

4.常用数据集

  1. IASP (International Affective Picture System)
  2. IASPa
  3. Abstract
  4. GAPED (Geneva Affective Picture Database)
  5. MART
  6. devArt
  7. Tweet
  8. FlickrCC (Flickr creative common)
  9. Flickr
  10. Emotion6
  11. FI (Flicker and Instagram)
  12. Emotion6
  13. IESN
  14. FlickrLDL
  15. TwitterLDL
     

 

  • 4
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
基于图像情感识别是近年来计算机视觉领域的热门研究方向。它通过分析人脸表情、姿态、语言等多种视觉信号来识别出人的情感状态,具有广泛的应用前景,如人机交互、娱乐、医疗等领域。 目前,基于图像情感识别主要分为两类:一类是基于传统机器学习算法,如支持向量机(SVM)、人工神经网络(ANN)等;另一类是基于深度学习算法,如卷积神经网络(CNN)、循环神经网络(RNN)等。 对于传统机器学习算法,其优点在于数据量较小时具有较好的性能,但在数据量较大时容易过拟合,且需要人工提取特征。而深度学习算法则能够从原始数据中自动学习特征,具有更好的泛化能力,且在大规模数据上取得了显著的成果。 近年来,基于深度学习算法的情感识别不断取得进展。如2013年,AlexNet等深度卷积神经网络的出现,使得计算机视觉领域的研究取得了突破性进展。2014年,微软研究院的DeepFace模型提出了一种基于深度学习的人脸表情识别方法,实现了较好的性能。2015年,Google提出的Inception-v3模型在情感识别任务上取得了较好的效果。 近年来,深度学习算法在情感识别领域的应用也变得越来越广泛。如2017年,由腾讯AI实验室和北京大学联合开发的Face++人脸识别技术,实现了情感识别、颜值评分等功能;2018年,华为发布的智能手机Mate 20 Pro,内置了基于深度学习情感识别技术,可以通过摄像头识别用户的情感状态。 总之,基于图像情感识别深度学习算法的推动下,正在逐步实现从实验室走向实际应用的转化,未来将会有更多的领域应用到这项技术中。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值