——基于电商领域的文本情感分析及主题挖掘——
一、数据预处理
本次的实现目标
1、利用文本挖掘技术,对碎片化、非结构化的电商网站评论数据进行清洗与处理,转化为结构化数据。
2、参考知网发布的情感分析用词语集,统计评论数据的正负情感指数,然后进行情感分析,通过词云图直观查看正负评论的关键词。
3、比较“机器挖掘的正负情感”与“人工打标签的正负情感”。
4、采用LDA主题模型提取评论关键信息,以了解用户的需求、意见、购买原因、产品的优缺点等。
导入所需要的工具包
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn