情感识别
文章平均质量分 92
BBJG_001
手与大脑的距离决定了理想与现实的相似度
展开
-
情感识别:一个基于CNN的文本情感识别实例
原文地址分类目录——情感识别之前写过几篇文章来进行文本数据的预处理,包括分词,去停用词,构造词向量。这里调用前文方法获得词向量,利用pytorch编写cnn程序进行情感识别。import torchimport torch.nn as nnimport torch.utils.data as Datafrom data_helper import do_data_helperimp...原创 2020-03-04 09:39:43 · 4195 阅读 · 1 评论 -
情感识别:构造词向量——word2vec应用实例
原文地址分类目录——情感识别导入支持包from gensim.models import word2vecimport logging设置打印日志# 用来打印日志# logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)构建要传入sente...原创 2020-02-24 09:41:43 · 2646 阅读 · 0 评论 -
文本情感分析:去停用词
原文地址分类目录——情感识别随便构造了一份测试数据如下,内容是gensim下的词向量生成模型word2vec的属性说明一种方式,通过正则表达式,这里以去标点符号为例,在分词之前进行操作import re# 通过正则表达式筛除string中的标点符号def clearn_str(string): # 筛除掉中文标点 string = re.sub(r'["#$%&...原创 2020-02-24 09:34:28 · 5777 阅读 · 5 评论 -
训练Word2Vec报错:RuntimeError: you must first build vocabulary before training the model
原文地址在定义模型时model = word2vec.Word2Vec(sentences, min_count=5)有一个min_count的属性,它的默认值是5,Word2Vec在训练时会忽略词频小于该属性值的词,发生这个报错是因为你传入的此列表中的所有词的词频都小于这个值。解决方案减小该值的设定...原创 2020-02-20 09:46:33 · 7434 阅读 · 3 评论 -
Word2Vec报错:KeyError: "word 'XXX' not in vocabulary"
原文地址发生在想通过model['XXX']观察一下XXX的词向量的时候原因一最简单的原因就是这个词不在你做来做训练的语料库中原因二在定义模型时model = word2vec.Word2Vec(sentences, min_count=5)有一个min_count的属性,它的默认值是5,Word2Vec在训练时会忽略词频小于该属性值的词,可能你进行观察的这个词的词频太低,...原创 2020-02-20 10:02:03 · 9645 阅读 · 10 评论 -
中文文本情感识别:jieba分词应用实例
原文地址分类目录——情感识别对于英文,其词法结构决定了其天生就是已经分词了的,通过空格分词即可print('I love you'.split(' ')) # 用空格切分长字符串# ['I', 'love', 'you']对于中文,就需要通过另外的手段进行分词了jieba这样一个功能包是中文文本分词的常用手段之一随便做了如下这样一个测试文件,内容是gensim下的词向量生成模型wo...原创 2020-02-23 09:46:57 · 3194 阅读 · 0 评论 -
openSMILE语音特征提取工具的使用
索引openSMILE语音特征提取工具的使用一、openSMILE简介二、openSMILE工作机制三、openSMILE Windows安装四、 特征提取实现五、 使用python编程批量提取语音特征openSMILE语音特征提取工具的使用一、openSMILE简介openSMILE是一个语音特征提取的工具,在语音识别(特征提取前端、关键字识别等.),情感计算(情感识别、敏感虚拟代理等),...原创 2019-12-21 20:51:47 · 8822 阅读 · 12 评论