DEAP数据集是一个基于主要基于脑电信号的可用于做情绪分析的数据集。数据集是由data和label两类数据组成的。data的结构是40*40*8064(刺激* 通道*数据),值得说明的是通道中只有前32个通道是脑电信号。label的结构是40*40*4,前两个40分别是刺激源和通道,后一个4是valence,arousal,dominance,liking。
我在data数据中选择了前22个人的全部40种刺激的32个脑电通道数据,label数据中,提取前22个人的全部40种刺激对应的vlaence和arousal的label,并且依据V_A两维高低的两两组合,以4为阀值,将其分成四个类。
下面介绍我使用的K-means算法。
设原始数据为{x1,x2,…,xn},四类的中心位置是{u1,u2,u3,u4},xn和uk都是向量。
迭代公式是:
公式一:求出所有数据和初始化的随机数据的距离,然后找出距离每个初始数据最近的数据。在我的算法中,距离的定义是对应项作差后取绝对值求和。
ci=argminj∥∥xi−uj∥∥
公式二:求出所有和这个初始数据最近原始数据的距离的均值。