感谢关注天善智能,走好数据之路↑↑↑
欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定!
本文作者:天善智能社区专家刘顺祥
天善智能社区地址:https://www.hellobi.com/
前言
在上一期《【干货】--手把手教你完成文本情感分类》中我们使用了R语言对酒店评论数据做了情感分类,基于网友的需求,这里再使用Python做一下复现。关于步骤、理论部分这里就不再赘述了,感兴趣的可以前往上面提到的文章查看。下面给出Python的具体代码。
Python代码
# 导入第三包
import jieba
from sklearn.feature_extraction.text importTfidfVectorizer
from sklearn.naive_bayes import GaussianNB
from sklearn.ensemble importRandomForestClassifier
from sklearn.cross_validation importtrain_test_split
from sklearn importmetrics
import pandas as pd
import matplotlib.pyplot as plt
# 读入评论数据
evaluation = pd.read_excel('Hotel Evaluation.xlsx',sheetname=1)
# 展示数据前5行
evaluation.head()