一个使用 EEG、生理和视频信号的情感分析数据集
1. abstract,摘要
我们提供了一个用于分析人类情感状态的多模态数据集。记录了 32 名参与者观看 40 个一分钟长的音乐视频摘录时的脑电图(EEG)和外周生理信号。参与者根据唤醒度、愉悦度、喜好 / 不喜欢、支配度和熟悉度等级别对每个视频进行了评分。对于 32 名参与者中的 22 名,还记录了额头面部视频。使用了一种新颖的刺激选择方法,利用了从 last.fm 网站的情感标签检索、视频亮点检测和在线评估工具。
该数据集已公开提供,我们鼓励其他研究人员将其用于测试其自己的情感状态估计方法。该数据集首次在以下论文中进行了介绍:“DEAP: A Database for Emotion Analysis using Physiological Signals (PDF)”, S. Koelstra, C. Muehl, M. Soleymani, J.-S. Lee, A. Yazdani, T. Ebrahimi, T. Pun, A. Nijholt, I. Patras, EEE Transactions on Affective Computing, vol. 3, no. 1, pp. 18-31, 2012
脑电图(EEG) 是一种用于测量大脑电活动的无创性神经生理学技术。它通过在头皮上放置一系列电极来记录大脑的电信号,这些信号反映了大脑神经元的活动。脑电图广泛用于临床医学、神经科学研究和脑机接口等领域。
在脑电图中,电极捕捉到的电信号以图形的形式呈现,通常是一系列的波形。这些波形包括不同频率的振荡,如:
- δ δ δ 波(Delta 波):频率范围通常在 0.5 到 4 赫兹(Hz)之间,主要与深度睡眠相关。
- θ θ θ 波(Theta 波):频率范围在 4 到 8 赫兹,通常与睡眠、放松和儿童的大脑活动有关。
- α α α 波(Alpha 波):频率范围在 8 到 13 赫兹,通常在休息状态下出现,闭上眼睛时尤为明显。
- β β β 波(Beta 波):频率范围在 13 到 30 赫兹,通常与警觉状态、注意力和思维活动有关。
- γ γ γ 波(Gamma 波):频率范围在 30 赫兹以上,与高级认知功能和信息处理有关。
脑电图在医学中被用来诊断和监测各种神经系统疾病,如癫痫、睡眠障碍和脑损伤。此外,它还被用于研究大脑的基本功能、认知过程、情感调控和脑机接口技术的开发。脑电图是一种重要的工具,可以帮助我们了解大脑的活动模式和健康状况。
不同频率的脑电波与不同情绪和认知状态之间存在一定的关联,尽管这种关联并不是绝对的,因为大脑活动是复杂的。以下是一些常见的情绪和认知状态与脑电波频率之间的关系:
- α α α 波(Alpha波):
- 放松: α α α 波的增加通常与放松状态相关,例如闭上眼睛、坐下休息时。
- 内省和冥想: α α α 波也与内省、冥想和深度集中注意力的状态相关。
- β β β 波(Beta 波):
- 警觉和专注:较高的 β β β 波活动通常伴随着警觉、专注和认知任务执行时的大脑活动。
- 焦虑:过多的 β β β 波活动有时与焦虑情绪相关,但这并不是唯一的因素。
- θ θ θ 波(Theta 波):
- 放松和创造性思维: θ θ θ 波活动增加可能伴随着放松、创造性思维和幻想。
- 深度冥想:在深度冥想状态下, θ θ θ 波的活动增加。
- δ δ δ 波(Delta波):
- 深度睡眠: δ δ δ 波主要在深度睡眠阶段出现,因此与休息和恢复有关。
需要注意的是,情绪和认知状态受到多种因素的影响,脑电波只是其中之一。此外,不同的情感和认知状态通常涉及多个脑区的协同工作,而不仅仅是特定频率的波动。
因此,虽然脑电波的频率可以提供关于大脑活动的线索,但要全面理解情感和认知状态,还需要考虑其他神经生理、心理和环境因素。
Last.fm 是一个音乐社交网站和互联网广播平台。它允许用户创建个人音乐配置文件、记录他们听过的音乐、与其他音乐爱好者互动以及发现新音乐。Last.fm 还提供了一种基于用户听歌历史的个性化音乐推荐服务,以及音乐活动和音乐会信息。用户可以通过 Last.fm 跟踪他们的音乐口味、建立音乐社交圈子,以及发现与他们的音乐兴趣相关的内容。
在研究和数据分析领域,Last.fm 的音乐标签和用户行为数据经常用于构建音乐推荐系统、分析音乐趋势以及研究用户的音乐偏好和行为。因此,Last.fm 的音乐标签和数据可以用于创建具有情感标签的音乐数据集,用于情感分析和研究。
2. dataset summary,数据集概况
DEAP 数据集包括两个部分:
【第一部分】来自在线自我评估的评分,其中每个来自音乐视频的一分钟片段都由 14 ~ 16 名志愿者基于激活度、愉悦度和支配度进行评分。
- 激活度(Arousal):衡量音乐视频是否引发了观众的兴奋程度。
- 愉悦度(Valence):用来表示音乐视频传达的情感是否是积极的或愉快的。
- 支配度(Dominance):反映了音乐视频对观众的控制程度。.
这些评分可以用来研究音乐和视频内容如何影响观众的情感和情感体验。
【第二部分】32 名志愿者观看了上述音乐视频的 40 个子集的实验中的参与者评分、生理记录和面部视频。记录了脑电图(EEG)和生理信号,每个参与者也按上述标准对视频进行了评分。对于 22 名参与者,还记录了正面面部视频。
- 参与者评分:与【第一部分】类似,观众对视频的激活度、愉悦度和支配度进行了评分,用于了解他们对视频内容的情感反应。
- 生理记录:这包括脑电图(EEG)和其他生理信号的记录。EEG 数据可以用来分析大脑活动,以了解观众在观看视频时的认知和情感响应。
- 面部视频:对于 22 名参与者,还记录了他们的正面面部视频。这可以用来分析面部表情和情感之间的关系,以及观众在观看视频时的情感体验如何在面部表情上体现出来。
有关数据集收集及其内容的更详细解释,请参阅 [1]。
第二部分的 32 名志愿者和第一部分的志愿者不同。第一部分的志愿者是独立的 14 到 16 名志愿者,他们观看了音乐视频的不同片段,并对这些片段进行了情感评分(激活度、愉悦度和支配度)。这些志愿者是用于构建第一部分数据的。
而第二部分的 32 名志愿者是另一组志愿者,他们观看了相同或类似的音乐视频子集,但他们是不同的个体,不包括第一部分的志愿者。这些第二部分的志愿者也进行了情感评分(激活度、愉悦度和支配度),并且额外记录了生理信号和面部视频。这个设计是为了在不同的志愿者群体中研究情感评分与生理 / 面部反应之间的关系以及情感体验的差异。
3. file listing,文件列表
以下文件可供使用(每个文件的详细说明如下):
文件名 | 格式 | 部分 | 内容 |
---|---|---|---|
Online_ratings | xls、csv、ods 电子表格 | 在线自我评估 | 在线自我评估中的所有个体评分 |
Video_list | xls、csv、ods 电子表格 | 两部分 | 在线自我评估和实验中使用的音乐视频的名称/YouTube链接,以及来自在线自我评估的个体评分统计信息 |
Participant_ratings | xls、csv、ods 电子表格 | 实验 | 参与者在实验期间对视频的所有评分 |
Participant_questionnaire | xls、csv、ods 电子表格 | 实验 | 参与者在实验前回答的问卷 |
Face_video | Zip 文件 | 实验 | 实验中参与者 1-22 的额头面部视频录像 |
Data_original | Zip 文件 | 实验 | 实验中未经处理的生理数据录音,以 BioSemi .bdf 格式存储 |
Data_preprocessed | 用于 Python 和 Matlab 的 Zip 文件 | 实验 | 实验中生理数据录音经过预处理(降采样、EOG 去除、滤波、分段等),以 Matlab 和 Python(numpy)格式存储 |
4. file details,文件细节
4.1 online_ratings,在线评分
此文件包含在线自评期间收集的所有个体视频评分。该文件以 Open-Office Calc(online_ratings.ods
)、Microsoft Excel(online_ratings.xls
)和逗号分隔值(online_ratings.csv
)格式提供。
评分是使用在线自评工具收集的,如 [1] 中所述。参与者使用离散的 9 点量表,使用 SAM 人物模型(SAM mannequins)评价 ① 唤醒(arousal)、② 愉悦度(valence) 和 ③ 支配度(dominance)。此外,参与者还使用情感轮(emotion wheel,参见 [2])评估了感觉到的情感。
“SAM"代表"Self-Assessment Manikin”,它是一种用于主观情感评估的工具,通常用于研究和测量人们的情感和情绪状态。SAM manikins 是一种心理学测量工具,用于让被试者以图形方式表示他们的情感体验。
SAM manikins 通常由一组具有不同表情的人物模型组成,这些人物模型代表了情感状态的不同维度。通常,SAM manikins 有三个维度:
- 唤醒(Arousal):这个维度表示情感状态的活跃程度或兴奋程度。在 SAM manikins 中,被试者被要求选择一个人物模型,该模型的姿态或表情最能反映他们当前的活跃程度。通常,左侧的人物模型表示低唤醒(如冷静、平静),而右侧的人物模型表示高唤醒(如兴奋、激动)。
- 愉悦度(Valence):这个维度表示情感状态的正负性质。在 SAM manikins 中,被试者被要求选择一个人物模型,该模型的姿态或表情最能反映他们当前的情感是积极的还是消极的。通常,左侧的人物模型表示负面情感,而右侧的人物模型表示正面情感。
- 支配度(Dominance):这个维度表示情感状态中个体的主动性或掌控程度。在 SAM manikins 中,被试者被要求选择一个人物模型,该模型的姿态或表情最能反映他们当前是否感到自己有控制权或支配局面。通常,上方的人物模型表示高支配度,而下方的人物模型表示低支配度。
通过选择 SAM manikins 上的适当人物模型,被试者可以用图形方式表达他们的情感状态,这使得情感评估更加客观和标准化。SAM manikins 经常用于情感心理学、情绪研究、人机交互等领域的实验和调查中。
离散的 9 点量表是一种常用于心理学和情感研究中的评分方式。它通常用于评估人们对某种情感或情感属性的主观感受,例如愉悦度、唤醒度、情感强度等。这个量表将评分分为 9 个不同的级别,每个级别都代表着不同的程度或感受。通常,这些级别在两个极端之间分布,例如从非常不愉快到非常愉快,或者从非常冷静到非常兴奋。参与者需要选择一个级别,以表达他们的主观感受或评价。
离散的 9 点量表通常用于获取离散的、有限数量的主观评分,而不是连续的、无限数量的评分。这种离散量表可以更容易地分析和解释,因为它将评分限制在了几个离散的选择之间,而不是一个连续的刻度。在情感研究中,愉悦度、唤醒度和支配度通常使用这种离散的 9 点量表来进行主观评估。
在情感心理学中,唤醒(arousal)、愉悦度(valence)和支配度(dominance)是描述情感和情绪的三个关键维度。它们通常用于对个体的情感状态和情绪体验进行定量测量和描述。
- 唤醒(Arousal): 唤醒描述了情感或情绪的生理兴奋水平或活跃程度。较高的唤醒表示个体处于更兴奋、更警觉或更激动的状态,而较低的唤醒表示个体处于更平静或更沉静的状态。唤醒通常与生理指标如心率、皮肤电活动等相关。
- 愉悦度(Valence): 愉悦度描述了情感或情绪的正负性质。较高的愉悦度表示情感更积极、更愉快、更正面,而较低的愉悦度表示情感更消极、更不愉快、更负面。愉悦度通常用于区分积极情感(如快乐)和消极情感(如悲伤)。
- 支配度(Dominance): 支配度描述了个体在特定情感状态下的主动性或控制感。较高的支配度表示个体感到更具支配性、更有控制力,而较低的支配度表示个体感到更被支配、更缺乏控制。支配度通常用于描述情感状态下的个体行为和情感的支配性。
“支配度”(Dominance)是情感心理学中描述情感和情绪的一个维度,它可能相对不太常见,不太容易理解。让我们进一步解释:
支配度描述了个体在某种情感状态下的主动性或控制感。换句话说,它衡量了个体在某一情感或情绪状态下是否感到自己处于掌控和主导的位置,或者是否感到受到他人或情境的支配。
举例来说,假设某人在某种情感状态下感到非常自信、坚定和有控制力,那么这个情感状态在支配度上可能会被描述为较高的支配度。这表示该个体在这种情感状态下感到自己具有支配和掌控局面的能力。
另一方面,如果某人在某种情感状态下感到不安、无助和被他人的影响所左右,那么这个情感状态在支配度上可能会被描述为较低的支配度。这表示该个体在这种情感状态下感到自己不太有控制力,更容易被外部因素或他人所影响。
支配度是情感维度的一部分,通常与唤醒(情感的活跃程度)和愉悦度(情感的正负性质)一起使用,以更全面地描述个体的情感体验。支配度的理解可能因文化、语境和研究领域而异,但它在研究情感和情绪时仍然具有价值,因为它有助于深入了解情感状态对个体行为和体验的影响。这些维度通常被用于研究情感和情绪,以便更准确地理解和描述个体的情感体验。它们也可用于评估文化、产品或媒体内容对个体情感的影响。
情感轮(Emotion Wheel)是一种用于描述和理解情感范围的图形工具。它通常以圆形图表的形式呈现,将不同的情感状态或情感类别排列在圆圈的不同部分。情感轮的目的是帮助人们识别、区分和表达各种情感,以便更好地理解和沟通情感经验。
情感轮通常分为不同的部分,每个部分代表一种情感或情感类别。这些部分通常以文字或短语的形式标记,以描述情感的性质。情感轮的设计可以根据特定的研究或应用需要而不同,但通常包括一系列基本情感状态,例如:
- 喜悦
- 愤怒
- 恐惧
- 悲伤
- 惊讶
- 厌恶
情感轮还可以进一步细分这些基本情感状态,以便更详细地描述情感体验。例如,喜悦可以分为幸福、满足、兴奋等子类别。这种细分有助于更准确地捕捉和表达情感。
情感轮通常用于心理学研究、情感分析、情感识别、心理治疗和情感智能等领域,以帮助人们更好地理解和管理情感。它也可以用作情感识别系统中的工具,以帮助计算机识别和理解人类情感。
文件中的表格每个个体评分有一行,包含以下列:
列名 | 描述 |
---|---|
Online_id | 与 video_list 文件中的相同视频 ID 对应的列 |
Valence | 愉悦度评分(1 到 9 之间的整数) |
Arousal | 唤醒评分(1 到 9 之间的整数) |
Dominance | 支配度评分(1 到 9 之间的整数) |
Wheel_slice | 情感轮上选择的部分对于一些参与者,情感轮评分未正确记录。在这些情况下,Wheel_slice 的值为0。否则,情感轮上的情感到整数的映射如下: 1. 自豪 2. 兴奋 3. 快乐 4. 满足 5. 安慰 6. 希望 7. 兴趣 8. 惊讶 9. 伤心 10. 恐惧 11. 羞耻 12. 内疚 13. 嫉妒 14. 厌恶 15. 蔑视 16. 愤怒 |
Wheel_strength | 情感轮上选择的强度(0 到 4 的整数 → 由弱到强) |
4.2 video_list,视频列表
这个文件列出了在线自评和实验中使用的所有视频,并以表格形式呈现。该文件提供了Open-Office Calc(video_list.ods
)、Microsoft Excel(video_list.xls
)和逗号分隔值(video_list.csv
)格式。
该表格每行代表一个视频,包含以下列:
列名 | 描述 |
---|---|
Online_id | 在线自评中使用的唯一标识 |
Experiment_id | 如果此视频被选为实验使用,列出了实验中使用的唯一标识。如果未被选中,则为空白 |
Lastfm_tag | 如果通过 last.fm 情感标签选择了此视频,则列出情感标签。否则为空白 |
Artist | 录制歌曲的艺术家 |
Title | 歌曲的标题 |
Youtube_link | 下载视频的原始 YouTube 链接。请注意,由于版权限制,我们无法提供我们使用的视频,这些链接可能已被删除或在您的国家不可用 |
Highlight_start | 根据 MCA 分析确定的提取的一分钟亮点开始的时间(以秒为单位)。对于一些视频,亮点被手动覆盖(例如,当歌曲的某一部分特别知名时) |
Num_ratings | 在线自评中对此视频进行评分的志愿者数量 |
VAQ_Estimate | 实验者选择此视频的愉悦度/唤醒度象限。对于每个象限,有 15 个视频是由 last.fm 选择的,另外 15 个是手动选择的。这些象限包括: 1. 高唤醒度,高愉悦度 2. 低唤醒度,高愉悦度 3. 低唤醒度,低愉悦度 4. 高唤醒度,低愉悦度 |
VAQ_Online | 由在线自评志愿者的平均评分确定的愉悦度/唤醒度象限。请注意,这些可能与估计的象限不同 |
AVG_x, STD_x, Q1_x, Q2_x, Q3_x | 在线自评志愿者对愉悦度/唤醒度/支配度的平均值、标准差以及第一、第二和第三四分位数 |
4.3 participant_ratings,参与者评分
这个文件包含了在实验期间收集的所有参与者对视频的评分。该文件以 Open-Office Calc(participant_ratings.ods
)、Microsoft Excel(participant_ratings.xls
)和逗号分隔值(participant_ratings.csv
)格式提供。
start_time 值是由演示软件记录的。愉悦度、唤醒度、支配度和喜好度是在每次试验后立即使用标准鼠标在连续的 9 点量表上评定的。愉悦度、唤醒度和支配度的评分使用 SAM 人体模型可视化呈现。对于喜好度(即您有多喜欢这个视频?),使用了拇指向上和拇指向下的图标。熟悉度是在实验结束后使用 5 点整数量表进行评定的(从“以前从未听过”到“定期听”)。遗憾的是,参与者 2、15 和 23 的熟悉度评分遗失了。
5 点整数量表是一种常用于心理学、市场调查和社会科学研究中的评分方式。它通常用于评估人们对某个属性、产品、情感或观点的主观感受或态度。这种量表将评分分为 5 个离散的级别,每个级别代表着不同的态度或感受。通常,这些级别从极端的否定到极端的肯定排列,中间还包括一个中性选项。参与者需要选择一个级别,以表示他们对特定对象或主题的态度或评价。
5 点整数量表通常用于获取有限数量的离散主观评分,而不是连续的、无限数量的评分。这种量表简单明了,容易理解,适用于各种调查和研究领域。在市场调查中,常常使用这种量表来评估产品满意度、广告效果、品牌偏好等。在心理学研究中,它也可以用于评估情感、态度、焦虑程度等。
该文件中的表格每行对应一个参与者对视频的评分,包含以下列:
列名 | 列内容 |
---|---|
Participant_id | 参与者的唯一标识号(1 - 32) |
Trial | 试验编号(即呈现顺序) |
Experiment_id | 与 video_list 文件中相同列的视频编号 |
Start_time | 试验视频播放的起始时间,单位为微秒(相对于实验开始时间) |
Valence | 愉悦度评分(浮点数,介于 1 和 9 之间) |
Arousal | 唤醒度评分(浮点数,介于 1 和 9 之间) |
Dominance | 支配度评分(浮点数,介于 1 和 9 之间) |
Liking | 喜好度评分(浮点数,介于 1 和 9 之间) |
Familiarity | 熟悉度评分(整数,介于 1 和 5 之间)。如果缺失,则为空白 |
4.4 participant_questionnaire,参与者问卷
该文件包含了实验前参与者填写的问卷答案。该文件提供了Open-Office Calc(participant_questionnaire.ods
)、Microsoft Excel(participant_questionnaire.xls
)和逗号分隔值(participant_questionnaire.csv
)格式。
问卷中的大多数问题都是多项选择题,基本可以理解。不幸的是,参与者 26 没有填写问卷。此问卷还包括对同意书上的问题的回答(数据是否可以用于研究,您的影像是否可以发布)。
4.5 face_video.zip,正脸视频
Face_video.zip
包含了实验中记录的前 22 位参与者的正脸视频,已分割成各个试验。在 zip 文件中,sXX/sXX_trial_YY.avi
对应于主题 XX
的试验 YY
的视频。
对于参与者 3、5、11 和 14,由于技术问题(即录像带用完了),最后几次试验中的一个或多个试验缺失。请注意,这些视频按照呈现顺序排列,因此试验编号与 video_list
文件中的 Experiment_id
列不对应。试验编号与 Experiment_ids
之间的映射可以在 participant_ratings
文件中找到。
视频是从放置在屏幕后面的三脚架上以 DV PAL 格式使用 SONY DCR-HC27E 摄像机录制的。然后,将视频根据试验进行分割,并使用 h264 编解码器转码为 50 fps 的去隔行视频。转码是使用 mencoder 软件执行的,命令如下:
mencoder sXX.dv -ss trialYY_start_second -endpos 59.05 -nosound -of avi -ovc x264
-fps 50 -vf yadif=1:1,hqdn3d -x264encopts bitrate=50:subq=5:8x8dct:frameref=2:bframes=3
-noskip -ofps 50 -o sXX_trialYY.avi
上面的代码是使用
mencoder
软件对录制的 DV PAL 格式视频文件sXX.dv
进行处理和转码,以创建一个 AVI 视频文件sXX_trialYY.avi
,其中XX
是主题编号,YY
是试次编号。
以下是代码的各个部分的解释:
mencoder sXX.dv
: 这部分指定了要处理的源视频文件,sXX.dv
是源文件名。-ss trialYY_start_second
: 这部分指定了从源视频中的哪个时间点开始处理。trialYY_start_second
是试次 YY 的起始时间点(以秒为单位)。这样可以选择从源视频的特定时间点开始处理。-endpos 59.05
: 这部分指定了要处理的视频持续时间。在这里,视频被裁剪为约 59.05 秒长。-nosound
: 这部分告诉mencoder
不包括音频。-of avi
: 这部分指定输出文件的格式为 AVI。-ovc x264
: 这部分指定了视频编解码器,使用 x264 编解码器进行视频压缩。-fps 50
: 这部分指定输出视频的帧速率为 50 帧每秒。-vf yadif=1:1,hqdn3d
: 这部分应用了视频滤镜。yadif
用于去除隔行扫描效果,hqdn3d
用于进行去噪处理。-x264encopts bitrate=50:subq=5:8x8dct:frameref=2:bframes=3
: 这部分指定了 x264 编解码器的选项,包括比特率、子像素质量、8x8DCT 变换等。-noskip
: 这部分禁止跳帧,确保所有帧都被编码。-ofps 50
: 这部分指定输出视频的帧速率为 50 帧每秒。-o sXX_trialYY.avi
: 这部分指定输出文件的名称,sXX_trialYY.avi
是输出文件的名称。
总之,这个代码片段的目的是将源视频文件进行处理,裁剪成指定持续时间的视频,并应用滤镜和编解码器,最终生成一个 AVI 格式的视频文件。
视频的同步精度大约为 1/25 秒(除了人为错误)。同步是通过在实验前后同时显示红色屏幕,并与发送到脑电图记录计算机的标记同步来实现的。然后,手动标记了该屏幕的起始帧在视频记录中的位置。然后,从脑电图记录中的试验开始标记计算各个试次的开始时间。
4.6 data_original.zip,原始数据
data_original.zip
中包含了原始的数据记录。共有 32 个 .bdf
文件(由 Actiview 录制软件生成的 BioSemi 数据格式),每个文件都有 48 个以 512Hz 采样的通道(32 个 EEG 通道,12 个外周通道,3 个未使用的通道和 1 个状态通道)。.bdf
文件可以由各种软件工具包读取,包括 Matlab 的 EEGLAB 和 BIOSIG 工具包。
数据是在两个不同的地点记录的。参与者 1-22 在 Twente 记录,参与者 23-32 在 Geneva 记录。由于硬件的不同版本,格式存在一些细微差异。首先,两个地点的 EEG 通道顺序不同。其次,每个地点的 GSR 测量数据格式也不同。
Twente 和 Geneva 是两个不同的地理位置或地点:
- Twente:Twente 是荷兰东部的一个地区,也是荷兰的一个行政区域。在上下文中,Twente 可能指的是在该地区或该地区附近进行的实验或数据记录。
- Geneva:Geneva 是瑞士的一座城市,位于瑞士法语区域,是国际外交和国际组织的重要中心。在上下文中,Geneva 可能指的是在该城市或该城市附近进行的实验或数据记录。
下表列出了两个地点的 EEG 通道名称(根据 10/20 系统)以及可用于将一种顺序转换为另一种顺序的索引:
通道编号 | Twente通道名 | Geneva通道名 | Geneva > Twente | Twente > Geneva |
---|---|---|---|---|
1 | Fp1 | Fp1 | 1 | 1 |
2 | AF3 | AF3 | 2 | 2 |
3 | F7 | F3 | 4 | 4 |
4 | F3 | F7 | 3 | 3 |
5 | FC1 | FC5 | 6 | 6 |
6 | FC5 | FC1 | 5 | 5 |
7 | T7 | C3 | 8 | 8 |
8 | C3 | T7 | 7 | 7 |
9 | CP1 | CP5 | 10 | 10 |
10 | CP5 | CP1 | 9 | 9 |
11 | P7 | P3 | 12 | 12 |
12 | P3 | P7 | 11 | 11 |
13 | Pz | PO3 | 16 | 14 |
14 | PO3 | O1 | 13 | 15 |
15 | O1 | Oz | 14 | 16 |
16 | Oz | Pz | 15 | 13 |
17 | O2 | Fp2 | 32 | 30 |
18 | PO4 | AF4 | 31 | 29 |
19 | P4 | Fz | 29 | 31 |
20 | P8 | F4 | 30 | 27 |
21 | CP6 | F8 | 27 | 28 |
22 | CP2 | FC6 | 28 | 25 |
23 | C4 | FC2 | 25 | 26 |
24 | T8 | Cz | 26 | 32 |
25 | FC6 | C4 | 22 | 23 |
26 | FC2 | T8 | 23 | 24 |
27 | F4 | CP6 | 20 | 21 |
28 | F8 | CP2 | 21 | 22 |
29 | AF4 | P4 | 18 | 19 |
30 | Fp2 | P8 | 17 | 20 |
31 | Fz | PO4 | 19 | 18 |
32 | Cz | O2 | 24 | 17 |
这个表格列出了两个地点(Twente 和 Geneva)的 EEG 通道名称及其相应的编号。Geneva 到 Twente 和 Twente 到 Geneva 的映射也在表格中提供。这些通道名称和编号是根据国际 10/20 系统制定的,用于标识头皮上的不同脑电通道。
剩余的通道编号在两个地点都是相同的。然而,请注意两个地点的皮肤电导(GSR)测量采用不同的单位。Twente 的 GSR 测量单位是纳西门子(nano-Siemens),而 Geneva 的 GSR 测量单位是欧姆(Ohm)。转换关系如下:
G S R G e n e v a = 1 0 9 / G S R T w e n t e \rm GSR_{Geneva} = 10^9 / GSR_{Twente} GSRGeneva=109/GSRTwente
下表解释了剩余通道的含义:
通道编号 | 通道名称 | 通道内容 |
---|---|---|
33 | EXG1 | hEOG1(位于左眼左侧) |
34 | EXG2 | hEOG2(位于右眼右侧) |
35 | EXG3 | vEOG1(位于右眼上方) |
36 | EXG4 | vEOG4(位于右眼下方) |
37 | EXG5 | zEMG1(颧弓肌主要肌肉,距离嘴角左侧约1厘米) |
38 | EXG6 | zEMG2(颧弓肌主要肌肉,距离zEMG1约1厘米) |
39 | EXG7 | tEMG1(斜方肌,左肩胛骨) |
40 | EXG8 | tEMG2(斜方肌,距离tEMG1约1厘米下方) |
41 | GSR1 | 皮肤电导反应,左手中指和无名指 |
42 | GSR2 | 未使用 |
43 | Erg1 | 未使用 |
44 | Erg2 | 未使用 |
45 | Resp | 呼吸带 |
46 | Plet | 充血计,左拇指 |
47 | Temp | 温度,左小指 |
48 | Status | 状态通道,包含标记 |
状态通道包含从刺激呈现计算机发送的标记,指示试验的开始和结束。以下状态标记被使用:
状态码 | 事件持续时间 | 事件描述 |
---|---|---|
1(第一次出现) | N/A | 实验开始(参与者按键开始) |
1(第二次出现) | 120,000 毫秒 | 基线记录开始 |
1(进一步出现) | N/A | 评分屏幕开始 |
2 | 1,000 毫秒 | 视频同步屏幕 (第一次试验之前,休息前后,最后一次试验后) |
3 | 5,000 毫秒 | 试验开始前的固定屏幕 |
4 | 60,000 毫秒 | 音乐视频播放开始 |
5 | 3,000 毫秒 | 音乐视频播放后的固定屏幕 |
7 | N/A | 实验结束 |
4.7 data_preprocessed_matlab.zip and data_preprocessed_python.zip
这些文件包含了一个经过降采样(至 128Hz)、预处理和分段处理的数据版本,以 Matlab(data_preprocessed_matlab.zip
)和 Python/Numpy(data_preprocessed_python.zip
)格式提供。这个数据版本非常适合那些希望快速测试分类或回归技术而不必首先处理所有数据的人。每个 zip 文件包含 32 个 .dat
(Python)或 .mat
(Matlab)文件,每个参与者一个。以下是加载 Python 数据文件的示例代码:
import cPickle
x = cPickle.load(open('s01.dat', 'rb'))
每个参与者文件包含两个数组:
数组名称 | 数组形状 | 数组内容 |
---|---|---|
data | 40 × 40 × 8064 40 × 40 × 8064 40×40×8064 | 视频/试验 × 通道 × 数据 |
labels | 40 × 4 40 × 4 40×4 | 视频/试验 × 标签 (愉悦度, 唤醒, 支配度, 喜好) |
DEAP 的数据包括两个主要的数组:
data
和labels
,其中:
data
数组:
- 数组形状: 40 × 40 × 8064 40 \times 40 \times 8064 40×40×8064
- 数组内容:视视频/试验 × 通道 × 数据
这个数组的维度解释如下:
- 第一个维度( 40 40 40):代表了数据库中的不同视频或试验。换句话说,DEAP数据库包含了 40 40 40 个独立的视频或试验的数据集。
- 第二个维度( 40 40 40):代表了每个视频或试验中采集的生理信号通道的数量。这意味着每个视频或试验包括 40 40 40 个不同的生理信号通道,例如心率、皮肤电导、脑电图等。
- 第三个维度( 8064 8064 8064):代表了每个通道中采集的数据点数。这个维度表示了每个通道的时间序列数据的长度,每个通道中包含 8064 8064 8064 个数据点。
labels
数组:
- 数组形状: 40 × 4 40 \times 4 40×4
- 数组内容:视频/试验 × 标签(愉悦度、唤醒度、支配度、喜好)
这个数组的维度解释如下:
- 第一个维度( 40 40 40):同样代表了数据库中的不同视频或试验。每一行对应于数据库中的一个视频或试验。
- 第二个维度( 4 4 4):代表了情感标签的种类,包括愉悦度、唤醒度、支配度和喜好。每个视频或试验都有与之关联的这四个情感标签的数值。
总之,DEAP 数据库中的data
数组包含了 40 40 40 个视频或试验的生理信号数据,每个视频/试验包括 40 40 40 个不同的通道,每个通道中有 8064 8064 8064 个数据点。而labels
数组包含了这 40 40 40 个视频/试验对应的愉悦度、唤醒度、支配度和喜好这四个情感标签的数值。这些数据可以用于情感分析和情感识别的研究。
视频按照 Experiment_id
的顺序排列,而不是按照演示顺序排列。这意味着每个参与者的第一个视频都是相同的。以下表格显示了通道布局和执行的预处理步骤:
通道编号 | 通道内容 | 预处理 |
---|---|---|
1 | Fp1 | |
2 | AF3 | |
3 | F3 | |
4 | F7 | |
5 | FC5 | |
6 | FC1 | |
7 | C3 | |
8 | T7 | |
9 | CP5 | |
10 | CP1 | |
11 | P3 | |
12 | P7 | |
13 | PO3 | |
14 | O1 | 1. 数据被降采样到128Hz |
15 | Oz | 2. EOG(眼电图)伪迹被移除,方法如[1]所述 |
16 | Pz | 3. 应用了4.0-45.0Hz的带通频率滤波器 |
17 | Fp2 | 4. 数据被平均到了共同的参考电极 |
18 | AF4 | 5. EEG通道被重新排序,以使它们都按照上面提到的Geneva顺序排列 |
19 | Fz | 6. 数据被分割成60秒的试验,并去除了3秒的预试验基线 |
20 | F4 | 7. 试验被重新排序,从演示顺序改为视频(Experiment_id)顺序 |
21 | F8 | |
22 | FC6 | |
23 | FC2 | |
24 | Cz | |
25 | C4 | |
26 | T8 | |
27 | CP6 | |
28 | CP2 | |
29 | P4 | |
30 | P8 | |
31 | PO4 | |
32 | O2 | |
---- | ------------------------------------------- | ------------------------------------------- |
33 | hEOG(水平眼电图,hEOG1 - hEOG2) | |
34 | vEOG(垂直眼电图,vEOG1 - vEOG2) | |
35 | zEMG(颧肌电图,zEMG1 - zEMG2) | 1. 数据被降采样到128Hz |
36 | tEMG(斜方肌电图,tEMG1 - tEMG2) | 2. 数据被分割成60秒的试验,并去除了3秒的试验前基线 |
37 | GSR(从Twente转换为Geneva格式的皮肤电导数据(欧姆)) | 3. 试验被重新排序,从演示顺序改为视频(Experiment_id)顺序 |
38 | 呼吸带 | |
39 | 测容量计 | |
40 | 温度 |
5. dataset access,数据集访问
为了获取数据集并下载此页面上的文件,请访问 DEAP 数据集请求服务器,以获取用户名和密码。您需要使用它们来访问以下文件。请注意,该数据集的许可仅限于学术研究。请注意,只有在学术 / 研究机构拥有永久职位的人员(用户)才能申请。用户必须使用其所在机构的电子邮件地址申请,并提供链接到其所在机构的网页,以验证其在机构的职位和电子邮件地址。
5.1 metadata,元数据
包含在四个电子表格中的所有元数据(在线评分、视频列表、参与者评分和参与者问卷)。提供以下格式:
- Open Office Calc (.ods) spreadsheets
- Microsoft Excel (.xls) spreadsheets
- Comma-separated value (.csv) files
5.2 physiological recordings,生理记录
记录了脑电图(EEG)和外周生理信号的数据。提供三种格式:BioSemi 的原始未处理数据(.bdf
格式),Matlab 和 Python(numpy)格式的预处理数据(详见数据集描述)。
- Original BioSemi (.bdf) format (5.8GB)
- Preprocessed data in Matlab format (2.9GB)
- Preprocessed data in Python format (2.7GB)
有一些人报告使用下载管理器下载这些大文件时遇到了问题。如果你也面临这个问题,还有一个多卷版本的文件,其中文件被分成了100MB的部分。
5.3 video recordings,视频记录
这是实验中参与者 1-22 的前额面部视频录像,格式为 h264。
如果您在使用下载管理器下载这个大文件时遇到问题,有一个多卷版本的文件可供选择,其中文件被分成了100MB的部分。这样可以更容易地下载和管理文件。