情感语义分析在生活中真是太常见不过了,不管跟一个人相处,还是在网上购物,以及其它种种,都涉及了语义的多样性,可见是中国文化博大精深。这次,我做的是一个购物评论的语义分析,就是所谓的好评或者差评。
# 读入原始数据集
import pandas as pd
df_pos = pd.read_excel("D:/自然语言技术/购物评论.xlsx", sheet_name = "正向", header=None)
df_pos['y'] = 1
df_neg = pd.read_excel("D:/自然语言技术/购物评论.xlsx", sheet_name = "负向", header=None)
df_neg['y'] = 0
data = df_pos.append(df_neg, ignore_index = True)
data.head()
# 分词和预处理,生成list of list格式
import jieba
data['cut'] = data[0].apply(jieba.lcut)
data.head()
#划分训练集测试集
from sklearn.model_selec