使用snownlp对Airbnb短租客的评论进行情感分析
一、数据来源
- 数据来源:
https://tianchi.aliyun.com/competition/entrance/231715/information
- 采用了reviews_detail.csv表的数据。本文主要关注房子id和房客评论;
- 使用了python3.7.1,PyCharm社区版2019.2。
二、数据读取及预处理
相关模块。
import pandas as pd
import re
from snownlp import SnowNLP
import matplotlib.pyplot as plt
# 解决中文无法显示的问题
plt.rc('font', family='SimHei', size='12')
读入需要的数据。
# 读入数据
io4 = 'D:/PythonProject/(天池)短租数据集分析/数据集-明细版/reviews_detail/reviews_detail.csv'
data2 = pd.read_csv(io4)
reviews_detail_df = pd.DataFrame(data2)
# 提取所需要的房子编号、评论内容
reviews_detail_df_l_c = reviews_detail_df[['listing_id', 'comments']].astype(str)
print('原始数据共:{}行'.format