一、引言
情感计算用来研究和开发具有认知、解释和模拟人类情感的系统和设备,是计算机科学、心理学和认知科学的交叉学科。情感计算的起源可追溯到早期对情感的哲学探讨,现在更多的是做为计算机科学人工智能的分支,最早由1995年的论文《affective
computing》提出。情感计算研究的一个动机是得到模拟同理心的能力,机器能解释并根据人类的情感状态来调整行为并能做出适当的反应来应对各种情绪[1]。对智能体的情感有两个研究方向,首先,他必须能预测别人的行为,通过理解他们的动作和情感状态(这涉及到博弈论、决策论以及人类情感建模和情感检测技术)。其次,对于好的人机交互,一个智能体需要表现出情感。至少它必须显得礼貌且对跟它互的人表现出情感。最好的是它拥有自主的情感[2]。
二、情感计算的两个研究领域
1.
检测和认知情感信息
检测情感信息从收集使用者的身体状态和行为的数据开始,这些数据用传感器收集且没有经过解释处理。这些采集人类感知他人情感所表现出来的信号的数据是相似的。例如,一个摄像机能记录面部表情,身体姿势和手势,同样一个麦克风能记录谈话。其他的传感器检测情感信号通过直接测量生理数据,如皮肤温度和电阻力。认知情感信息需要从采集的数据中提取有意义的样式。它需要使用机器学习技术来处理不同的谈话认知、自然语言处理形态或面部表情检测,对每一个产生一个标签(如“困惑”)[1]。
2. 机器情感
另一个情感计算的领域是设计有情感计算能力的设备,该设备能展示出天生的情感能力或由模拟情感的能力。一个更实际的方式,基于现在的工艺水平,是模拟谈话智能体的情感,以便丰富和便利人类和机器的交互。人类情感经常伴随荷尔蒙和神经肽水平的高涨,机器的情感在一个自治学习系统里可能要与抽象状态相关,如进度(或缺乏进度)[1]。
三、基于情感计算的技术
1.
富有情感的讲话方式
神经系统不自主的变化会改变讲话方式,我们可以利用这个信息通过提取谈话特征来制造有认知能力的系统。例如,在一种害怕、愤怒或高兴的状态下谈话会变得更快,更大声,发音更准确清晰。其他的情绪如疲倦、厌烦或悲伤,会导致谈话速度慢,音调低和发音含糊。富有情感的谈话通过分析谈话模式会认知使用者的情绪状态。通过模式识别分析发音和节奏的情况如音调变化和谈话速率[1]。
谈话认知是一个识别情感状态的好办法,研究报告表明平均成功率为63%[3],在人类识别情感的成功率方面这个结果是令人满意的。但与其他形式的情感识别比较还有一点不足(如那些利用生理状态或面