一种基于心理行为特征识别的谈话(询问)方法

技术领域

本发明涉及情绪分析技术领域,更为具体地,涉及一种基于心理行为特征识别的询问装置。

背景技术

伴随科学技术飞速的发展和人们逐渐对计算机越来越依赖,人类与计算机之间的“沟通”变得更加受科学家们的关注。目前在执法、医疗、教育、心理咨询等行业的谈话(询问),通过面对面的语音相互交流,采用人工笔记的记录来实现谈话(询问)内容的备案保存和管理,并且不能对谈话(询问)过程的文本和音视频实现同步保存和备份管理;同时对谈话(询问)的心理行为特征的判断主要是供过人眼的直觉感受判断,以及人的听觉器官对语义的获取再通过大脑的理解,来综合判断对方在谈话(询问)之中的心理行为反应。 目前,人们的谈话(询问)方式的缺点是谈话(询问)内容需要人工笔记记录,笔记记录时间比谈话(询问)速度慢,影响谈话(询问)的效果,同时现有的谈话(询问)模式,判断谈话(询问)对方的心理行为特征是个人凭大脑的直觉感受来判断,可能存在每个人的大脑直觉判断有所出入,同时在大脑直觉判断上对不同程度的心理行为特征的判断没有一个明确的数据指标。因此,目前谈话(询问)应用场景中没有提出有效的有关心理行为的评价解决方案。

发明内容

本发明的目的在于克服现有技术的不足,提供一种基于心理行为特征识别的谈话(询问)方法应用于谈话(询问)场景,以加强谈话(询问)双方的多途径多方式的心理行为特征的识别。本发明的目的是解决目前谈话(询问)中,为不可记录的心理行为状态提供一种可视化智能化的人工评价技术,为执法、医疗、教育、心理咨询等行业提出了一个智能的谈话(询问)解决方案。

本发明目的是通过以下技术方案来实现:

一种基于心理行为特征识别的谈话(询问)方法:主要包括语音采集设备、视频采集设备、询问终端主机、打印机、显示设备等其他附件。

视频采集设备主要是结合语音采集设备同步实现对实时音视频的信息采集。

询问终端主机主要包括语音识别模块、情绪特征识别模块、心理行为识别模块、同步录音录像模块、系统管理模块等功能。语音识别模块主要功能把谈话内容转换成文本信息,替代人工记录谈话内容。情绪特征识别模块主要包括有语音情感识别功能、人脸面部表情识别功能、文本情感识别、眼动轨迹情感识别、姿态情感识别等功能的一种或者任意多模态的组合;其中姿态情感识别包括头部姿态、形体姿态、手势姿态、步行姿态等其中的一种或者多种。语音情感识别模块主要作用通过语音采集设备采集的语音信息,通过情绪识别模块的语音情感识别功能识别采集的语音情感特征;视频采集设备采集的视频信息通过情绪识别的人脸面部表情识别功能识别人脸面部表情情感特征;文本情感识别功能对语音采集设备采集的语音信息,通过语音识别转换成文本信息后,通过文本情感特征数据库的特征情感识别;眼动轨迹情感识别对视频采集设备采集的眼动轨迹进行情感特征的识别;姿态情感识别根据视频采集的姿态行文信息根据姿态情感数据库进行姿态情感特征识别;情感识别模块根据同步的语音情感特征、面部表情特征、文本情感特征、眼动轨迹情感特征、姿态情感特征的相同情感特征的映射特征融合,通过多核函数和权重的计算,得到语音情感特征、人脸面部表情情感特征、文本情感特征、眼动轨迹情感特征、姿态情感特征等多维度情感特征融合的谈话(询问)情感状态。心理行为数据库是心理专家根据视频信息的声音压力、语音文本内容、面部表情情感特征、眼动轨迹情感特征、姿态情感特征等多维度实时信息的经验集成判断,建立的心理行为特征的数据库,心理专家也可以结合相关的语音情感识别工具、面部表情识别工具以及语音文本情感识别工具、眼动轨迹情感识别工具、姿态情感识别工具的综合运用,实现对多维度情感特征的专家判断后,结合心理行为数据库的应用,完成多维度谈话(询问)心理行为数据的标注;例如标注可以是紧张、害怕、犹豫、期待、撒谎、分心、冲突、排斥等,心理行为数据库的主要功能是根据采集识别的多维度情感融合特征识别谈话(询问)心理行为特征。同步录音录像模块,采集谈话(询问)中的视频及音频数据实现同步的数据保存和备份,并与语音识别模块识别的文本数据一起实现对谈话(询问)过程中同步音视频和文本数据的保存和备份。系统管理模块,对数据来源模块经过系统处理后生成的结果进行查看、统计和日志管理,以及数据的输出。

打印设备:对数据结果的接收后打印输出便于纸质文件的保存。

显示设备:主要用于对采集、分析及管理的数据进行显示。

进一步的,包括:

语音采集设备可以是拾音器、麦克风、电话或者其他录音设备;麦克风包括一种矩阵式麦克风,通过内置角色分离算法,把相互谈话人员的声音独立隔离出2路或多路独立的音频,传输给询问终端主机。

本发明的有益效果是:

(1)本发明通过语音识别功能和同步录音录像模块同步记录谈话(询问)的音视频和文本数据,以便保存和备份当次谈话的文本和音视频数据。

(2)本发明通过情感识别模块对谈话(询问)对象实时的情感特征进行识别,通过心理行为特征数据库对识别的情感特征进行心理行为特征识别,以记录谈话(询问)对象在某段谈话(询问)时间内的心理行为特征和对应的心理行为特征值;例如在紧张、害怕、犹豫、期待、撒谎、分心、冲突、排斥等评价指标中的数值来记录与评价其心理行为的活动。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的装置结构框图。

图2为本发明的心理行为特征识别流程图。

具体实施方式

下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。本说明书中公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。

本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。

下面将详细描述本发明的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。在以下描述中,为了提供对本发明的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的电路,软件或方法。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在对实施例进行描述之前,需要对一些必要的术语进行解释。例如:

若本申请中出现使用“第一”、“第二”等术语来描述各种元件,但是这些元件不应当由这些术语所限制。这些术语仅用来区分一个元件和另一个元件。因此,下文所讨论的“第一”元件也可以被称为“第二”元件而不偏离本发明的教导。应当理解的是,若提及一元件“连接”或者“联接”到另一元件时,其可以直接地连接或直接地联接到另一元件或者也可以存在中间元件。相反地,当提及一元件“直接地连接”或“直接地联接”到另一元件时,则不存在中间元件。

在本申请中出现的各种术语仅仅用于描述具体的实施方式的目的而无意作为对本发明的限定,除非上下文另外清楚地指出,否则单数形式意图也包括复数形式。

当在本说明书中使用术语“包括”和/或“包括有”时,这些术语指明了所述特征、整体、步骤、操作、元件和/或部件的存在,但是也不排除一个以上其他特征、整体、步骤、操作、元件、部件和/或其群组的存在和/或附加。

如图1~2所示:

一种基于心理行为特征识别的谈话(询问)方法:主要包括语音采集设备、视频采集设备、询问终端主机、打印机、显示设备等其他附件。

视频采集设备主要是结合语音采集设备同步实现对实时视频的信息采集。

询问终端主机主要包括语音识别模块、情绪特征识别模块、心理行为识别模块、同步录音录像模块、系统管理模块等功能。语音识别模块主要功能把谈话内容转换成文本信息,替代人工记录谈话内容。情绪特征识别模块主要包括有语音情感识别功能、人脸面部表情识别功能、文本情感识别、眼动轨迹情感识别、姿态情感识别等功能的一种或者任意多模态的组合;其中姿态情感识别包括头部姿态、形体姿态、手势姿态、步行姿态等其中的一种或者多种。语音情感识别模块主要作用通过语音采集设备采集的语音信息,通过情绪识别模块的语音情感识别功能识别采集的语音情感特征;视频采集设备采集的视频信息通过情绪识别的人脸面部表情识别功能识别人脸面部表情情感特征;文本情感识别功能对语音采集设备采集的语音信息,通过语音识别转换成文本信息后,通过文本情感特征数据库的特征情感识别;眼动轨迹情感识别对视频采集设备采集的眼动轨迹进行情感特征的识别;姿态情感识别根据视频采集的姿态行文信息根据姿态情感数据库进行姿态情感特征识别;情感识别模块根据同步的语音情感特征、面部表情特征、文本情感特征、眼动轨迹情感特征、姿态情感特征的相同情感特征的映射特征融合,通过多核函数和权重的计算,得到语音情感特征、人脸面部表情情感特征、文本情感特征、眼动轨迹情感特征、姿态情感特征等多维度情感特征融合的谈话(询问)情感状态。心理行为数据库是心理专家根据视频信息的声音压力、语音文本内容、面部表情情感特征、眼动轨迹情感特征、姿态情感特征等多维度实时信息的经验集成判断,建立的心理行为特征的数据库,心理专家也可以结合相关的语音情感识别工具、面部表情识别工具以及语音文本情感识别工具、眼动轨迹情感识别工具、姿态情感识别工具的综合运用,实现对多维度情感特征的专家判断后,结合心理行为数据库的应用,完成多维度谈话(询问)心理行为数据的标注;例如标注可以是紧张、害怕、犹豫、期待、撒谎、分心、冲突、排斥等,心理行为数据库的主要功能是根据采集识别的多维度情感融合特征识别谈话(询问)心理行为特征。同步录音录像模块,采集谈话(询问)中的视频及音频数据实现同步的数据保存和备份,并与语音识别模块识别的文本数据一起实现对谈话(询问)过程中同步音视频和文本数据的保存和备份。系统管理模块,对数据来源模块经过系统处理后生成的结果进行查看、统计和日志管理,以及数据的输出。

打印设备:对数据结果的接收后打印输出便于纸质文件的保存。

显示设备:主要用于对采集、分析及管理的数据进行显示。

进一步的,包括:

语音采集设备可以是拾音器、麦克风、电话或者其他录音设备;麦克风包括一种矩阵式麦克风,通过内置角色分离算法,把相互谈话人员的声音独立隔离出2路或多路独立的音频,传输给询问终端主机。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值