nlp
826560347
这个作者很懒,什么都没留下…
展开
-
中文和英文传统NLP情感分析
2020美赛C题我使用的情感分析方法 目前,一种快速的文本情感分析程序支持英语和中文。 实现原理如下: 加载情感词典(分为正词/负词/度词/负词)和切分。 正负词的情感价值是通过关键词匹配来积累的。正负词的默认情感值分别为1 / -1。 3检索并验证文本中否定词的语义,并通过多次检查再次确认肯定和否定词 通过特定的间隔衰减功能控制重复强调的程度 获得的整体情绪值介于-6到+ 6之间,以及分段分析的...原创 2020-04-07 11:48:39 · 814 阅读 · 0 评论 -
一种简单的统计词频的方式
一种简单的统计词频的方式 我是将我要处理的数据从tsv写到txt然后统计词频,如果换成自己的数据的话只需要将要分词的文本保存到txt中。 import jieba #用jieba库进行分词 from nltk.corpus import stopwords import pandas as pd import csv train=pd.read_csv(r'/home/good.tsv',...原创 2020-04-07 11:42:06 · 306 阅读 · 0 评论