![](https://img-blog.csdnimg.cn/20190927151043371.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
NLP
文章平均质量分 58
NLP分词去停、词频统计、情感分析、情感聚类。讲解+代码
#温室里的土豆
学习追星两不误
展开
-
python爬虫
有问题的可以评论区留言~ 希望能帮助到有需要的人~主要利用requests来实现的。只要找到对应的url即可,原创 2022-10-04 23:41:02 · 318 阅读 · 1 评论 -
基于词典的细粒度情感分析
1 细粒度情感分析传统的情感分析大多是针对句子级的,即某条评论或某句话为积极或消极的概率。而往往一句话中包含着多个描述点,即方面级的述评,这时用一个模糊的概率或数字去评价整段文字或整句话势必是不准确和不公允的。如“我的男朋友性格很好,很专一,但有一些社恐”、“酒店很不错,视野一绝,早餐很棒,但就有一些贵”等。基于此,需要对文本内容进行细粒度的情感分析,以达到更好的分析效果。目前,能够实现细粒度情感分析的途径大致有以下几种:...原创 2022-04-16 22:44:11 · 2535 阅读 · 8 评论 -
对指定关键词进行词频统计
过往的词频统计都是针对整个文档进行的,而如果研究中需要知道单条评论或某个研究单元内某些词的词频,那么就需要进行额外的处理。原理非常的简单,就是遍历筛选,具体做法为去除停用词的逆运算。Step1:分词最基本的处理的就不做多余的赘述,直接上码:def seg_word(data): seg_result=[] stop_list = open('哈工大停用词表.txt','r',encoding='utf-8').read() for sentence in data:原创 2022-03-11 19:23:35 · 2165 阅读 · 0 评论 -
基于TF-IDF与k-means的情感聚类
目前很多情感聚类都是细分到逐词分析,而对于逐句的情感分析可以通过将文本转化为数字矩阵从而采用传统的聚类方法来实现,这里以K均值为例进行演示:import pandas as pd import codecsimport matplotlib.pyplot as pltfrom sklearn.feature_extraction.text import TfidfTransformer from sklearn.feature_extraction.text impor...原创 2022-03-06 18:32:09 · 2866 阅读 · 2 评论 -
基于文本挖掘的情人节微信聊天记录情感分析
铁子们,明天就是情人节啦,不知道各位是否已经开学和对象见面了呀哈哈,可惜我还是个没有对象的可怜鬼,但没有不要紧,咱可以假装拥有哈哈,所以今天准备实践一下基于文本挖掘的微信聊天记录分析,为以后做准备嘛不是。。。这里就用和大学本科好基友的聊天记录作为语料库啦。整个分析流程分为以下几个部分:目录1.微信聊天记录获取2.数据清洗2.1 分词、去停、去重2.2 外部词典调用3.数据分析3.1 词频分析与词云展示3.2 LDA主题概率模型及pyLDAvis可视化3....原创 2022-02-13 14:46:34 · 3455 阅读 · 13 评论