情感分析
文章平均质量分 71
ASS-ASH
人工智能,机器学习,深度学习,自然语言处理,情感分析
展开
-
程序运行出现 UndefinedMetricWarning: Precision and F-score are ill-defined and being set to 0.0 in labels
程序运行时出现以下问题·:UndefinedMetricWarning: Precisionand F-score are ill-defined and being set to 0.0 in labels with no predicted samples. Use `zero_division` parameter to control this behavior.并且模型学习过程中验证集准确率一直在50%,最后结果也是百分之50%以二分类为例,就是说程序分类的预测标签上只有一类..原创 2022-03-26 20:29:11 · 7567 阅读 · 0 评论 -
Python利用玻森情感词典判断句子情感分值
import pandas as pdimport jiebadf = pd.read_table(r"D:\BosonNLP_sentiment_score.txt",sep= " ",names=['key','score'],engine='python',encoding='utf-8')key = df['key'].values.tolist()score = df['score'].values.tolist()def getscore(f): segs .原创 2022-03-08 14:41:24 · 1855 阅读 · 3 评论 -
机器学习即服务:关于情感分析的10个应用场景和4个服务
情感分析是什么?用户生成内容的爆炸式增长和档案材料的数字化创造了大量的数据集,其中包含了许多人对几乎每一个主题发表的观点。在某些情况下,该数据的生成是通过用户界面构造的。例如,在电子商务网站上处理客户评论相对容易,因为用户需要在产品评论的文本旁边发布一个简单的评级。然而,大多数数据都以非结构化形式提供。它没有一个标准的总结说“这个内容表达了一个积极的,消极的,混合的或中立的观点。”例如,WordPress.com报道说,仅在2018年5月,博客作者们使用他们的平台发表了超过8700万篇文章。原创 2021-09-08 21:07:51 · 4228 阅读 · 1 评论 -
-文本分类
目录第11章 文本分类11.1 文本分类的概念11.2 文本分类语料库11.3 文本分类的特征提取11.4 朴素贝叶斯分类器11.5 支持向量机分类器11.6 标准化评测11.7 情感分析11.8 总结第11章 文本分类上一章我们学习了文本聚类,体验了无须标注语料库的便利性。然而无监督学习总归无法按照我们的意志预测出文挡的类别,限制了文本聚类的应用场景。有许多场景需要将文档分门别类地归入具体的类别中,比如垃圾邮件过滤和社交媒体的自动标签推荐。在这一章中,我..原创 2021-08-29 19:40:07 · 3088 阅读 · 0 评论 -
文本聚类!
目录第10章 文本聚类10.1 概述10.2 文档的特征提取10.3 k均值算法10.4 重复二分聚类算法10.5 标准化评测10.6 总结第10章 文本聚类上一章我们在字符、词语和句子的层级上应用了一些无监督学习方法。这些方法可以自动发现字符与字符、词语与词语、乃至句子与句子之间的联系,而不需要标注语料。同样,在文档层级上,无监督方法也可以在缺乏标注数据的条件下自动找出文档与文档之间的关联。正所谓物以类聚,人以群分。人类获取并积累信息时常常需要整理数据,将相..原创 2021-08-29 16:02:47 · 12313 阅读 · 1 评论 -
隐马尔可夫模型与序列标注(详解)(续)
隐马尔可夫模型在HanLP中的实现称为FirstOrderHiddenMarkovModel,本案例中的隐马尔可夫模型用Python 描述如下(详见tests/book/ch04/doctorjimm.py):In[]:# -*- coding:utf-8 -*-# Author:hankcs# Date: 2018-06-17 11:32# 《自然语言处理入门》4.4 隐马尔可夫模型的训练# 配套书籍:http://nlp.hankcs.com/book.php...原创 2021-05-10 21:15:57 · 1342 阅读 · 0 评论 -
隐马尔可夫模型与序列标注详解
目录第4章 隐马尔可夫模型与序列标注4.1 序列标注问题4.2 隐马尔可夫模型4.3 隐马尔可夫模型的样本生成4.4 隐马尔可夫模型的训练4.5 隐马尔可夫模型的预测4.6 隐马尔可夫模型应用于中文分词4.7 性能评测4.8 总结第4章 隐马尔可夫模型与序列标注比如这句话:头上戴着束发嵌宝紫金冠,齐眉勒着二龙抢珠金抹额加粗词语是现代入相对陌生的两个“新词”,但我们依然认识它们。当读者读到“戴着”时,心里就已经开始期待一个描述帽饰的名词了。另外,既然.原创 2021-05-10 20:01:07 · 1710 阅读 · 0 评论 -
基于微博评论的情感分析研究(小记)
搜集了大量微博研究的相关文献之后,目前使用最多的研究方法是情感词典的方法:通过构建相应的微博情感词典,分析微博评论的极性;另一种是机器学习的方法,通过构建的模型判断文字正负。建立了专属于微博的情感词典,选择相关的微博评论,提高情感分类的准确率。过程概述:获取相关评论文本,进行预处理,然后,使用专属于微博的情感词典,对其进行特征提取等操作,和相应的处理消极词汇、程度副词、微博表情符号、情感词和评价对象的微博评论。最后采用算法公式,对已处理好的数据进行正负分类,达到一个准确的分类效果。在微博上挑选热点话原创 2021-05-09 20:58:26 · 7447 阅读 · 0 评论 -
图文融合微博情感分析(小记)
单独基于文本和图片方法,不能充分挖掘微博用户情感问题,提出图文融合的微博情感分析方法。对大规模图片数据集上预训练的CNN模型参数进行迁移,以微调的方式训练图片情感分类模型FCNN;训练词向量输入可提取文本语义单元上下文特征的双向LSTM中,训练文本情感分类模型WBLSTM;根据late fusion的模型融合思想,设计模型融合公式融合FCNN和WBLSTM模型,进行图文融合的微博情感分析。目前图文融合的微博情感分析存在问题:图片的低层特征和中层属性并不能高度抽象图片的情感,导致图片情感分类效果不佳。原创 2021-05-09 20:53:35 · 2605 阅读 · 10 评论 -
文本情感分析思维导图
文本情感分析思维导图原创 2021-05-09 20:26:13 · 904 阅读 · 0 评论 -
关于商品评论的情感分析方法研究(小记)
关于商品评论的情感分析方法研究(论文阅读记录)对商品评论进行分析挖掘,得出情感倾向,为消费者提供参考,帮助卖家完善商品质量,提高服务水平。研究机器学习和深度学习的情感分析:比较了jieba、pyhanlp、snownlp分词技术对模型的影响。jieba分析在速度和质量上优于其他两种。用word2vector(实现词组稠密化表示)训练词向量作为输入。有CBOW(上下文词组独热编码向量作为输入,输出中心词词向量)和、SKip-gram(中心词组独热编码向量作为输入,输出上下文词组词向量)两种方式训练。原创 2021-05-09 20:38:01 · 1424 阅读 · 2 评论 -
基于卷积神经网络的商品评论情感分析的研究(小记)
从句子结构和词向量出发,设计了基于特征融合的分段卷积神经网络文本情感分析模型,分段提取句子的主要特征,利用词性特征和词向量融合的方法,解决词向量无法区分同义词的问题。与传统文本卷积神经网络相比,用精确率、召回率和F1值作为评判指标。普通的基于卷积神经网络的文本情感分析主要两个缺陷:词向量训练无法区分一词多义现象,文本词向量表示不准确,容易发生过拟合现象;从句子特征提取一个最大的值,没有进行多段分析,尤其是对于转折句,容易提取到转折前句子中情感词特征,从而进行误判。主要工作:(1)详细介绍各.原创 2021-05-09 20:42:31 · 1159 阅读 · 0 评论 -
文本情感分析方法及应用综述(小记)
分析总结:面向不同应用场景,主要有基于情感词典与规则、基于传统机器学习与基于深度学习三种文本情感分析方法。近年来基于多策略混合的方法逐渐成为重要的改进方法。主要是从宏观技术角度对方法和应用综述分析。面向商业决策等应用场景有很大的发展潜力。文本细粒度,可以从文档级,句子级和方面级对文本的情感极性进行分类。文档和句子为粗层次;方面级针对语料中的对象或实体进行更细粒度的情感分类。有待提升:网络新语层出不穷,已有情感词汇含义不断发...原创 2021-05-09 20:49:00 · 1373 阅读 · 1 评论