个人课题:言语评估

emotion: 情感,情绪,主观的。label一般是:happy、sad、angry
sentiment: 态度,情绪,意见。positive、negative,nature

课题数据集处理:
数据情况:
训练集+验证集:2783;测试集(相同题目):299,测试集(不同题目):344。

初步, 类标先不平衡, 直接去学,看整体打分预测效果怎样。
类标选择二人取平均、

最终生成:
train,
dev,
test,

nlp_trans.npy(每一条数据的文本)
label(数据的标签)
audio_mfcc(音频特征)
seqN(mfcc的长度)
audio_prosody(韵律特征)

中文词向量,对于不存在的词,随机初始向量,设为可训练的。

audio特征提取:
直接一条完整的音频,19858长度,10M左右
原始长度:1423左右。

修改MFCC12EDA_conf参数:frameSize 0.025 -> 0.25, frameStep 0.01 -> 0.1
长度变为1984

mfcc需要后处理:
每行 39维,

(n, row, col),n指数据个数, 后面两个为每条数据的mfcc特征维度(750, 39)

row>750,只取750. (数据需要统计)
现在,2783 * 2377 * 39

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值