泰迪杯C题-第一问

景区及酒店印象分析

  • 计算每个景区、酒店TOP20热门词,保存如“A01.csv”或“H02.csv”。以及画出词云图

导入库

import re # 正则表达式库
import collections # 词频统计库
import numpy as np # numpy数据处理库
import jieba # 中文分词
import pandas as pd 
import wordcloud # 词云展示库
from PIL import Image # 图像处理库
import matplotlib.pyplot as plt # 图像展示库

读取数据

jingqu = pd.read_excel(r'F:\桌面\比赛数据1\data\附件1\景区评论.xlsx')
jiudian = pd.read_excel(r'F:\桌面\比赛数据1\data\附件1\酒店评论.xlsx')
jingqu_comment = jingqu.at[jingqu_index,'评论内容']
jingqu_comment
jingqu
jiudian = jiudian[['酒店名称','评论内容']]
jiudian = jiudian.set_index('酒店名称')
jiudian
评论内容
酒店名称
H01酒店很适合家庭出行
H01升级了房间 延迟退房 很赞
H01这几年,每年都会来广州,每次都会住**酒店。因为位置好,酒店的性价比也不错,这次给免费升级了...
H01酒店很好不错
H01超五星好评
......
H50酒店是老字号宾馆,虽然有装修过但设施比较陈旧房间空调比较小,卫生间里的墙壁有剥落现象,浴室的...
H50本人觉得还好,价格偏高,没有很高档,服务是很好,设施偏老,也不会很大,喜欢楼下的早茶。
H50隔音极差,睡眠让人崩溃。
H50酒店位置很好,停车场比较小。
H50位置好找,停车方便,酒店太老了!

25225 rows × 1 columns

数据处理——景区

##########做景区的索引############
import codecs
import csv
# 这里的停词库用了很多
#中文、哈工大、百度、川大机器实验室
stopwords = set()
fr = codecs.open(r'C:\Users\kingS\SVM\stop_words.txt', 'r', 'utf-8')
for word in fr:
    stopwords.add(str(word).strip())
fr.close()
jingqus_indexs = []
for i in range(51):
    if i < 10:
        jingqu_i = 'A0'+str(i)
        jingqus_indexs.append(jingqu_i)
    else:
        jingqu_i = 'A'+str(i)
        jingqus_indexs.append(jingqu_i)
    # print(jingqu.at['A01','评论内容'])
jingqu_indexs = jingqus_indexs[1:]
for jingqu_index in jingqu_indexs:
    # print(jingqu_index)
    # print(jingqu.at[jingqu_index,'评论内容'])
    jingqu_comment = jingqu.at[jingqu_index,'评论内容']
    # 转换成str型
    jingqu_comment = str(jingqu_comment)
    pattern = re.compile(u'\t|\n|\.|-|:|;|\)|\(|\?|"|\d|\W') # 定义正则表达式匹配模式
    string_data = re.sub(pattern, '',jingqu_comment) # 将符合模式的字符去除
    # print(string_data)
    # 文本分词

    seg_list_exact = jieba.cut(string_data, cut_all = False) # 精确模式分词
    object_list = []
    # 可以自己定义专属,你时间多的话
    #remove_words = [u'的', u',',u'和', u'是', u'随着', u'对于', u'对',u'等',u'能',u'都',u'。',u' ',u'、',u'中',u'在',u'了',
                #u'通常',u'如果',u'我们',u'需要',u'景区',u'景点',u'还是',u'很',u'很',u'就',u'我',u'去',u'感觉',u'去',u'以下'] # 自定义去除词库
    remove_words = stopwords
    for word in seg_list_exact: # 循环读出每个分词
        if word not in remove_words: # 如果不在去除词库中
            object_list.append(word) # 分词追加到列表
        # 词频统计
    word_counts = collections.Counter(object_list) # 对分词做词频统计
    word_counts_top20 = word_counts.most_common(20) # 获取前10最高频的词
    print (word_counts_top20) # 输出检查
    print('---------------------------分割线----------------------')
    n = word_counts_top20
    b = ['评论热词','热度']
    file_name = jingqu_index + '.csv'
    # 做词云图,先将储存代码注释起来
    with open(file_name,'w',newline='') as t:#numline是来控制空的行数的
        writer=csv.writer(t)#这一步是创建一个csv的写入器
        writer.writerow(b)#写入标签
        writer.writerows(n)#写入样本数据
    # 词频展示
    mask = np.array(Image.open('词云背景图.png')) # 定义词频背景
    wc = wordcloud.WordCloud(
        font_path='C:/Windows/Fonts/simhei.ttf', # 设置字体格式
        mask=mask, # 设置背景图
        max_words=200, # 最多显示词数
        max_font_size=100 # 字体最大值
    )

    wc.generate_from_frequencies(word_counts) # 从字典生成词云
    image_colors = wordcloud.ImageColorGenerator(mask) # 从背景图建立颜色方案
    wc.recolor(color_func=image_colors) # 将词云颜色设置为背景图方案
    plt.imshow(wc) # 显示词云
    plt.axis('off') # 关闭坐标轴
    file_name_image = jingqu_index
    plt.savefig(file_name_image,dpi=500)
[('表演', 8), ('食物', 7), ('动物园', 6), ('动物', 6), ('火车', 5), ('吃', 5), ('来到', 5), ('房间', 4), ('广州', 4), ('白虎', 4), ('摩天轮', 4), ('一只', 4), ('节假日', 3), ('缆车', 3), ('步行', 3), ('北门', 3), ('大象', 3), ('马戏', 3), ('精彩', 3), ('喜欢', 3)]
---------------------------分割线----------------------
[('表演', 9), ('烟花', 7), ('园区', 6), ('项目', 6), ('晚上', 5), ('餐厅', 4), ('不错', 4), ('巡游', 4), ('湖边', 4), ('灯光', 4), ('时间', 3), ('排队', 3), ('吃', 3), ('游玩', 3), ('不想', 3), ('真的', 3), ('鲸鲨', 3), ('套餐', 3), ('点', 3), ('找', 3)]
---------------------------分割线----------------------
[('垃圾', 5), ('订票', 2), ('合适', 2), ('景区', 2), ('破', 2), ('景色', 2), ('前', 1), ('看好', 1), ('预定', 1), ('需知', 1), ('省', 1), ('到时候', 1), ('麻烦', 1), ('通票', 1), ('便宜', 1), ('两个', 1), ('谷要', 1), ('好几个', 1), ('项目', 1), ('没开', 1)]
---------------------------分割线----------------------
[('项目', 6), ('原因', 3), ('迪士尼', 3), ('夜场', 2), ('景色', 2), ('体验', 2), ('刺激', 2), ('说', 1), ('便宜', 1), ('禁忌', 1), ('少', 1), ('包', 1), ('事实上', 1), ('人太少', 1), ('玩起来', 1), ('气候', 1), ('天气', 1), ('开好', 1), ('几个', 1), ('开', 1)]
---------------------------分割线----------------------
[('晚上', 5), ('挺', 4), ('夜场', 4), ('感觉', 4), ('世界', 4), ('景点', 3), ('时间', 3), ('著名', 3), ('景区', 3), ('逛', 2), ('完', 2), ('天气', 2), ('买', 2), ('门票', 2), ('只能', 2), ('金字塔', 2), ('表演', 2), ('缩微', 2), ('歌舞', 2), ('比例', 2)]
---------------------------分割线----------------------
[('摩天轮', 4), ('值得', 3), ('夜景', 3), ('广州', 3), ('走', 3), ('排队', 2), ('买', 2), ('提前', 2), ('取票', 2), ('多到', 2), ('说', 2), ('小时', 2), ('照片', 2), ('推荐', 2), ('孩子', 2), ('地方', 2), ('点', 2), ('楼', 2), ('不用', 1), ('一去', 1)]
---------------------------分割线----------------------
[('演出', 5), ('夜场', 4), ('门票', 3), ('收费', 3), ('体验', 2), ('导游', 2), ('出游', 2), ('包含', 2), ('前', 2), ('白天', 2), ('棒', 2), ('太大', 2), ('晚上', 1), ('挺', 1), ('微缩', 1), ('景观', 1), ('闭园', 1), ('风格', 1), ('鬼屋', 1), ('整体', 1)]
---------------------------分割线----------------------
[('熊猫', 3), ('动物', 3), ('门票', 2), ('表演', 2), ('点', 2), ('不错', 2), ('分', 2), ('很大', 1), ('感觉', 1), ('只值', 1), ('观看', 1), ('海豚', 1), ('点点', 1), ('百兽', 1), ('盛会', 1), ('两个', 1), ('精彩', 1), ('国庆', 1), ('人太多', 1), ('早', 1)]
---------------------------分割线----------------------
[('景区', 18), ('取票', 4), ('景点', 4), ('饭店', 3), ('丹霞', 3), ('元山', 2), ('便宜', 2), ('我国', 2), ('管理', 2), ('差', 2), ('标志', 2), ('距离', 2), ('景色', 2), ('走', 2), ('冤枉路', 2), ('照相', 2), ('目的', 2), ('摊位', 2), ('买票', 2), ('售票', 1)]
---------------------------分割线----------------------
[('适合', 6), ('项目', 3), ('表演', 3), ('动物', 3), ('买', 3), ('小孩', 2), ('世界', 2), ('园内', 2), ('味道', 2), ('地球村', 2), ('现场', 2), ('海洋馆', 2), ('套票', 2), ('卖', 2), ('农庄', 2), ('不错', 2), ('图片', 1), ('位置', 1), ('分享', 1), ('值得', 1)]
---------------------------分割线----------------------
[('适合', 3), ('总体', 2), ('孩子', 2), ('套票', 2), ('划算', 2), ('拍照', 2), ('挺', 1), ('树木', 1), ('晒米', 1), ('好多', 1), ('游玩', 1), ('项目', 1), ('建议', 1), ('买', 1), ('风景', 1), ('景美', 1), ('朋友', 1), ('开心', 1), ('星期一', 1), ('没什么', 1)]
---------------------------分割线----------------------
[('超级', 4), ('捞鱼', 3), ('好玩', 3), ('提前', 2), ('订票', 2), ('二维码', 2), ('小孩', 2), ('大人', 2), ('喜欢', 2), ('锦鲤', 2), ('小鱼', 2), ('阿姨', 2), ('时时', 2), ('漂亮', 1), ('景色', 1), ('优美', 1), ('空气清新', 1), ('鸟语花香', 1), ('一幅幅', 1), ('风景画', 1)]
---------------------------分割线----------------------
[('温泉', 4), ('不错', 3), ('餐厅', 2), ('宝宝', 2), ('池', 2), ('下次', 2), ('还会', 2), ('环境', 2), ('大好', 1), ('美', 1), ('设计', 1), ('风格', 1), ('独特', 1), ('干净', 1), ('面对', 1), ('大海', 1), ('心情', 1), ('广阔', 1), ('大小', 1), ('设施', 1)]
---------------------------分割线----------------------
[('感觉', 3), ('照片', 3), ('大自然', 2), ('鬼斧神工', 2), ('拍照', 2), ('石梯', 2), ('瑶寨', 2), ('地下河', 2), ('值得', 2), ('地方', 2), ('够', 2), ('态度', 2), ('不好', 2), ('问', 2), ('回答', 2), ('网络', 1), ('购票', 1), ('人工', 1), ('售票', 1), ('效率', 1)]
---------------------------分割线----------------------
[('表演', 4), ('好玩', 2), ('企鹅', 2), ('美人鱼', 2), ('太', 1), ('超赞', 1), ('超级', 1), ('推荐', 1), ('小孩子', 1), ('喜欢', 1), ('跟着', 1), ('水貂', 1), ('跑', 1), ('不停', 1), ('进场', 1), ('稍微', 1), ('晚', 1), ('点', 1), ('白鲸', 1), ('两遍', 1)]
---------------------------分割线----------------------
[('不错', 238), ('景点', 194), ('景区', 193), ('值得', 173), ('观音', 167), ('风景', 150), ('地方', 137), ('南海', 116), ('景色', 97), ('佛山', 88), ('门票', 85), ('空气', 84), ('走', 74), ('环境', 71), ('西樵', 60), ('开车', 59), ('爬山', 59), ('上山', 58), ('很大', 58), ('一去', 57)]
---------------------------分割线----------------------
[('不错', 238), ('景区', 196), ('景色', 149), ('景点', 145), ('门票', 137), ('值得', 135), ('风景', 129), ('肇庆', 116), ('地方', 105), ('公园', 85), ('感觉', 85), ('走', 75), ('适合', 63), ('游玩', 58), ('星湖', 57), ('贵', 57), ('环境', 57), ('美', 55), ('游船', 51), ('收费', 50)]
---------------------------分割线----------------------
[('不错', 203), ('免费', 193), ('门票', 165), ('珠海', 154), ('北京', 125), ('景点', 121), ('值得', 115), ('建筑', 109), ('公园', 105), ('表演', 102), ('地方', 102), ('景色', 92), ('挺', 86), ('感觉', 76), ('景区', 73), ('园林', 59), ('建筑群', 56), ('收费', 56), ('风景', 53), ('历史', 51)]
---------------------------分割线----------------------
[('不错', 235), ('湖', 196), ('风景', 129), ('值得', 121), ('景色', 121), ('湖水', 112), ('景点', 98), ('岛', 95), ('取票', 91), ('游船', 89), ('水', 88), ('绿', 87), ('三个', 71), ('游玩', 71), ('岛上', 69), ('空气', 69), ('感觉', 65), ('坐船', 64), ('地方', 60), ('环境', 60)]
---------------------------分割线----------------------
[('不错', 226), ('缆车', 151), ('风景', 131), ('取票', 125), ('景区', 114), ('值得', 99), ('索道', 93), ('景色', 93), ('门票', 86), ('地方', 86), ('爬山', 77), ('景点', 77), ('空气', 75), ('爬', 72), ('好玩', 70), ('小时', 69), ('买', 69), ('山顶', 64), ('顶', 62), ('走', 62)]
---------------------------分割线----------------------
[('不错', 240), ('广州', 235), ('风景', 112), ('地方', 102), ('爬山', 96), ('景区', 93), ('爬', 89), ('门票', 86), ('空气', 81), ('景点', 77), ('山顶', 77), ('景色', 76), ('值得', 70), ('休闲', 63), ('好去处', 62), ('缆车', 59), ('走', 58), ('山', 57), ('空气清新', 54), ('便宜', 51)]
---------------------------分割线----------------------
[('不错', 214), ('风景', 118), ('值得', 113), ('地方', 103), ('爬山', 97), ('观音', 80), ('山顶', 78), ('空气', 77), ('走', 66), ('景色', 66), ('上山', 60), ('爬', 59), ('感觉', 57), ('环境', 56), ('挺', 56), ('门票', 55), ('东莞', 51), ('下山', 50), ('坐车', 44), ('适合', 42)]
---------------------------分割线----------------------
[('不错', 197), ('园林', 145), ('值得', 132), ('中山', 100), ('地方', 88), ('景色', 85), ('环境', 75), ('岭南', 66), ('门票', 61), ('感觉', 57), ('苏州园林', 52), ('挺', 51), ('适合', 50), ('风景', 47), ('特色', 45), ('景点', 43), ('取票', 42), ('一去', 39), ('建筑', 39), ('贵', 38)]
---------------------------分割线----------------------
[('温泉', 326), ('不错', 219), ('环境', 106), ('池', 79), ('值得', 72), ('水上', 70), ('设施', 69), ('服务', 68), ('乐园', 63), ('下次', 60), ('地方', 57), ('挺', 53), ('好玩', 53), ('开心', 50), ('感觉', 49), ('干净', 46), ('泡温泉', 45), ('水果', 45), ('水', 43), ('小孩', 43)]
---------------------------分割线----------------------
[('温泉', 303), ('不错', 237), ('服务', 183), ('环境', 107), ('吃', 102), ('感觉', 90), ('地方', 78), ('庙会', 77), ('值得', 70), ('干净', 67), ('自助餐', 56), ('日式', 56), ('挺', 55), ('舒服', 55), ('池', 54), ('泡', 54), ('珠海', 53), ('下次', 51), ('池子', 50), ('晚上', 46)]
---------------------------分割线----------------------
[('不错', 141), ('景点', 119), ('建筑', 103), ('值得', 101), ('自力', 91), ('开平', 84), ('特色', 78), ('地方', 75), ('立园', 67), ('门票', 62), ('取票', 62), ('景区', 61), ('村', 58), ('赤坎', 56), ('感觉', 51), ('历史', 46), ('世界', 36), ('影视城', 36), ('买', 35), ('时间', 34)]
---------------------------分割线----------------------
[('不错', 189), ('沙滩', 95), ('地方', 88), ('浪漫', 79), ('环境', 74), ('取票', 67), ('景色', 63), ('值得', 61), ('晚上', 59), ('好玩', 58), ('适合', 51), ('海滩', 49), ('海水', 47), ('景区', 45), ('风景', 44), ('门票', 43), ('表演', 40), ('感觉', 40), ('挺', 39), ('情侣', 37)]
---------------------------分割线----------------------
[('取票', 146), ('不错', 124), ('排队', 101), ('便宜', 100), ('套票', 62), ('沙滩', 58), ('买', 53), ('不用', 47), ('挺', 44), ('好玩', 42), ('窗口', 40), ('地方', 39), ('买票', 39), ('码头', 38), ('二楼', 37), ('旅游', 35), ('值得', 35), ('海鲜', 34), ('下次', 34), ('时间', 32)]
---------------------------分割线----------------------
[('不错', 143), ('值得', 111), ('空气', 93), ('地方', 91), ('景区', 88), ('景点', 83), ('门票', 78), ('景色', 73), ('蝴蝶谷', 71), ('风景', 64), ('爬山', 51), ('氧吧', 45), ('空气清新', 44), ('负离子', 43), ('肇庆', 42), ('走', 40), ('天然', 39), ('环境', 38), ('感觉', 38), ('挺', 36)]
---------------------------分割线----------------------
[('动物', 345), ('动物园', 182), ('不错', 105), ('门票', 80), ('挺', 78), ('海洋馆', 71), ('小朋友', 68), ('地方', 59), ('值得', 56), ('喜欢', 49), ('小孩', 49), ('表演', 45), ('种类', 41), ('广州', 41), ('孩子', 39), ('便宜', 36), ('适合', 36), ('交通', 35), ('很大', 33), ('好玩', 33)]
---------------------------分割线----------------------
[('不错', 114), ('景区', 103), ('值得', 78), ('瑶族', 72), ('表演', 65), ('风景', 63), ('太', 51), ('地方', 51), ('景点', 49), ('取票', 47), ('门票', 46), ('景色', 45), ('说', 41), ('感觉', 40), ('特色', 35), ('挺', 34), ('寨子', 33), ('小时', 32), ('走', 31), ('空气', 28)]
---------------------------分割线----------------------
[('不错', 177), ('温泉', 157), ('环境', 104), ('服务', 76), ('池', 72), ('挺', 51), ('干净', 48), ('下次', 44), ('值得', 43), ('池子', 41), ('地方', 41), ('设施', 40), ('感觉', 37), ('舒服', 37), ('取票', 36), ('泡', 36), ('开心', 33), ('好玩', 31), ('免费', 28), ('水果', 27)]
---------------------------分割线----------------------
[('不错', 106), ('游戏', 94), ('机动', 88), ('适合', 74), ('好玩', 56), ('小孩', 53), ('值得', 45), ('开心', 44), ('小朋友', 43), ('地方', 43), ('游玩', 42), ('景区', 36), ('设施', 31), ('喜欢', 30), ('水上', 29), ('项目', 28), ('挺', 27), ('环境', 27), ('免费', 26), ('景色', 24)]
---------------------------分割线----------------------
[('不错', 101), ('项目', 96), ('好玩', 74), ('开心', 37), ('门票', 35), ('设施', 35), ('孩子', 34), ('地方', 34), ('值得', 32), ('刺激', 30), ('小孩', 29), ('东西', 26), ('工作人员', 24), ('买', 24), ('汕头', 24), ('时间', 23), ('太', 23), ('景区', 22), ('体验', 20), ('贵', 20)]
---------------------------分割线----------------------
[('瀑布', 128), ('不错', 126), ('景色', 79), ('值得', 67), ('景区', 55), ('景点', 50), ('门票', 48), ('壮观', 41), ('环境', 31), ('挺', 30), ('取票', 28), ('空气', 28), ('瀑布群', 27), ('走', 26), ('美', 26), ('地方', 24), ('风景', 23), ('好玩', 21), ('分', 20), ('山路', 19)]
---------------------------分割线----------------------
[('景区', 134), ('陶瓷', 103), ('不错', 67), ('地方', 64), ('佛山', 55), ('景点', 54), ('值得', 54), ('门票', 46), ('文化', 41), ('特色', 39), ('石湾', 38), ('历史', 33), ('挺', 32), ('喜欢', 28), ('便宜', 25), ('公仔', 23), ('博物馆', 22), ('买', 21), ('陶艺', 20), ('适合', 19)]
---------------------------分割线----------------------
[('温泉', 126), ('不错', 92), ('环境', 62), ('值得', 45), ('池', 44), ('干净', 31), ('好玩', 29), ('感觉', 28), ('地方', 27), ('设施', 26), ('服务', 25), ('下次', 24), ('水质', 23), ('温泉水', 22), ('泡', 22), ('舒服', 22), ('泡温泉', 18), ('前台', 18), ('挺', 18), ('便宜', 17)]
---------------------------分割线----------------------
[('温泉', 172), ('不错', 77), ('池', 56), ('环境', 54), ('干净', 33), ('服务', 32), ('感觉', 32), ('泡', 31), ('下次', 29), ('舒服', 29), ('地方', 29), ('阳西', 28), ('挺', 27), ('开心', 27), ('设施', 24), ('真的', 24), ('值得', 24), ('水', 24), ('水上', 20), ('乐园', 20)]
---------------------------分割线----------------------
[('不错', 78), ('动物', 77), ('公园', 66), ('值得', 41), ('地方', 40), ('好玩', 33), ('适合', 32), ('门票', 30), ('挺', 28), ('环境', 27), ('小孩', 26), ('喜欢', 23), ('开心', 22), ('小孩子', 19), ('景点', 19), ('空气', 19), ('孩子', 16), ('游玩', 16), ('茂名', 16), ('动物园', 16)]
---------------------------分割线----------------------
[('岛上', 91), ('不错', 85), ('海鲜', 77), ('景色', 50), ('风景', 45), ('海水', 45), ('沙滩', 43), ('住', 36), ('岛', 34), ('景区', 32), ('美', 31), ('地方', 31), ('干净', 27), ('值得', 27), ('小岛', 25), ('珠海', 24), ('吃', 23), ('特别', 23), ('清澈', 23), ('爬山', 23)]
---------------------------分割线----------------------
[('岛上', 81), ('不错', 66), ('风景', 39), ('值得', 34), ('地方', 32), ('海水', 31), ('景色', 30), ('贵', 26), ('住', 26), ('景点', 24), ('吃', 24), ('取票', 23), ('感觉', 23), ('环境', 23), ('沙滩', 22), ('设施', 21), ('挺', 21), ('好玩', 20), ('潜水', 20), ('岛', 18)]
---------------------------分割线----------------------
[('不错', 107), ('温泉', 101), ('环境', 77), ('服务', 37), ('挺', 35), ('舒服', 29), ('池', 28), ('地方', 28), ('下次', 27), ('值得', 25), ('服务态度', 22), ('前台', 19), ('感觉', 19), ('开心', 19), ('好好', 19), ('泡', 17), ('干净', 16), ('服务员', 16), ('设施', 16), ('便宜', 16)]
---------------------------分割线----------------------
[('不错', 106), ('岛上', 82), ('岛', 78), ('度假村', 51), ('红树林', 48), ('码头', 40), ('湛江', 34), ('值得', 32), ('地方', 32), ('景色', 29), ('温泉', 26), ('没什么', 26), ('沙滩', 25), ('门票', 25), ('环境', 25), ('度假', 24), ('景点', 24), ('风景', 23), ('船票', 23), ('电瓶车', 22)]
---------------------------分割线----------------------
[('地方', 70), ('不错', 61), ('自行车', 44), ('风景', 44), ('东莞', 43), ('骑', 40), ('景色', 31), ('很大', 31), ('值得', 28), ('湖', 28), ('环境', 27), ('骑行', 27), ('松湖', 26), ('周末', 22), ('美', 20), ('单车', 20), ('景点', 20), ('适合', 20), ('空气', 18), ('休闲', 18)]
---------------------------分割线----------------------
[('景区', 59), ('不错', 54), ('空气', 50), ('景点', 50), ('茶园', 42), ('景色', 41), ('值得', 38), ('环境', 32), ('门票', 32), ('地方', 31), ('茶', 28), ('古韵', 20), ('茶田', 19), ('桥溪', 18), ('空气清新', 18), ('感觉', 17), ('开车', 17), ('取票', 16), ('服务', 16), ('没什么', 16)]
---------------------------分割线----------------------
[('栈道', 106), ('景区', 95), ('不错', 72), ('玻璃', 68), ('值得', 60), ('景点', 52), ('天道', 50), ('走', 45), ('景色', 39), ('风景', 35), ('缆车', 33), ('取票', 27), ('感觉', 26), ('时间', 24), ('门票', 24), ('地方', 22), ('好玩', 22), ('说', 21), ('特别', 21), ('观光车', 20)]
---------------------------分割线----------------------
[('不错', 63), ('庄园', 60), ('温泉', 49), ('适合', 41), ('门票', 41), ('项目', 38), ('设施', 32), ('地方', 31), ('环境', 30), ('小孩', 24), ('乐园', 24), ('挺', 23), ('值得', 23), ('游玩', 21), ('表演', 20), ('好玩', 20), ('感觉', 19), ('黑森林', 19), ('度假', 18), ('建筑', 18)]
---------------------------分割线----------------------
[('不错', 88), ('五台山', 61), ('取票', 55), ('景区', 53), ('导游', 37), ('地方', 28), ('佛教', 26), ('门票', 23), ('凑', 23), ('字', 23), ('买', 21), ('挺', 20), ('高速', 18), ('五爷', 17), ('庙', 17), ('时间', 17), ('圣地', 16), ('太', 16), ('值得', 15), ('服务', 15)]
---------------------------分割线----------------------
[('不错', 66), ('观音', 56), ('景区', 51), ('莲花', 50), ('挺', 35), ('值得', 34), ('风景', 33), ('采石场', 29), ('广州', 27), ('景色', 26), ('地方', 25), ('门票', 25), ('望海', 23), ('景点', 22), ('特别', 21), ('环境', 20), ('山顶', 19), ('香火', 19), ('游玩', 18), ('空气', 16)]
---------------------------分割线----------------------
[('景区', 72), ('瀑布群', 54), ('黄山', 52), ('走', 46), ('不错', 45), ('值得', 37), ('公园', 36), ('空气', 35), ('景点', 33), ('水谷', 32), ('地方', 31), ('景色', 31), ('瀑布', 29), ('广东', 28), ('门票', 28), ('适合', 28), ('风景', 27), ('亲', 24), ('开车', 23), ('入口', 22)]
---------------------------分割线----------------------

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZV0AG6no-1620232197724)(output_8_1.png)]

数据处理-酒店

jiudian = jiudian[['酒店名称','评论内容']]
jiudian.set_index('酒店名称')
评论内容
酒店名称
H01酒店很适合家庭出行
H01升级了房间 延迟退房 很赞
H01这几年,每年都会来广州,每次都会住**酒店。因为位置好,酒店的性价比也不错,这次给免费升级了...
H01酒店很好不错
H01超五星好评
......
H50酒店是老字号宾馆,虽然有装修过但设施比较陈旧房间空调比较小,卫生间里的墙壁有剥落现象,浴室的...
H50本人觉得还好,价格偏高,没有很高档,服务是很好,设施偏老,也不会很大,喜欢楼下的早茶。
H50隔音极差,睡眠让人崩溃。
H50酒店位置很好,停车场比较小。
H50位置好找,停车方便,酒店太老了!

25225 rows × 1 columns

for i in range(51):
    if i < 10:
        jiudian_i = 'H0'+str(i)
        jiudian_indexs.append(jiudian_i)
    else:
        jiudian_i = 'H'+str(i)
    # print('fenge')
        jiudian_indexs.append(jiudian_i)
print(jiudian_indexs)
['H00', 'H01', 'H02', 'H03', 'H04', 'H05', 'H06', 'H07', 'H08', 'H09', 'H10', 'H11', 'H12', 'H13', 'H14', 'H15', 'H16', 'H17', 'H18', 'H19', 'H20', 'H21', 'H22', 'H23', 'H24', 'H25', 'H26', 'H27', 'H28', 'H29', 'H30', 'H31', 'H32', 'H33', 'H34', 'H35', 'H36', 'H37', 'H38', 'H39', 'H40', 'H41', 'H42', 'H43', 'H44', 'H45', 'H46', 'H47', 'H48', 'H49', 'H50', 'H00', 'H01', 'H02', 'H03', 'H04', 'H05', 'H06', 'H07', 'H08', 'H09', 'H10', 'H11', 'H12', 'H13', 'H14', 'H15', 'H16', 'H17', 'H18', 'H19', 'H20', 'H21', 'H22', 'H23', 'H24', 'H25', 'H26', 'H27', 'H28', 'H29', 'H30', 'H31', 'H32', 'H33', 'H34', 'H35', 'H36', 'H37', 'H38', 'H39', 'H40', 'H41', 'H42', 'H43', 'H44', 'H45', 'H46', 'H47', 'H48', 'H49', 'H50']
##########做景区的索引############
import codecs
import csv
# 这里的停词库用了很多
#中文、哈工大、百度、川大机器实验室
stopwords = set()
fr = codecs.open(r'C:\Users\kingS\SVM\stop_words.txt', 'r', 'utf-8')
for word in fr:
    stopwords.add(str(word).strip())
fr.close()
jiudian_indexs = []
for i in range(51):
    if i < 10:
        jiudian_i = 'H0'+str(i)
        jiudian_indexs.append(jiudian_i)
    else:
        jiudian_i = 'H'+str(i)
    # print('fenge')
        jiudian_indexs.append(jiudian_i)
    # print(jingqu.at['A01','评论内容'])
jiudian_indexs = jiudian_indexs[1:]
for jiudian_index in jiudian_indexs:
    # print(jingqu_index)
    # print(jingqu.at[jingqu_index,'评论内容'])
    jiudian_comment = jiudian.at[jiudian_index,'评论内容']
    # 转换成str型
    jiudian_comment = str(jiudian_comment)
    pattern = re.compile(u'\t|\n|\.|-|:|;|\)|\(|\?|"|\d|\W') # 定义正则表达式匹配模式
    string_data = re.sub(pattern, '',jiudian_comment) # 将符合模式的字符去除
    # print(string_data)
    # 文本分词

    seg_list_exact = jieba.cut(string_data, cut_all = False) # 精确模式分词
    object_list = []
    # 可以自己定义专属,你时间多的话
    #remove_words = [u'的', u',',u'和', u'是', u'随着', u'对于', u'对',u'等',u'能',u'都',u'。',u' ',u'、',u'中',u'在',u'了',
                #u'通常',u'如果',u'我们',u'需要',u'景区',u'景点',u'还是',u'很',u'很',u'就',u'我',u'去',u'感觉',u'去',u'以下'] # 自定义去除词库
    remove_words = stopwords
    for word in seg_list_exact: # 循环读出每个分词
        if word not in remove_words: # 如果不在去除词库中
            object_list.append(word) # 分词追加到列表
        # 词频统计
    word_counts = collections.Counter(object_list) # 对分词做词频统计
    word_counts_top20 = word_counts.most_common(20) # 获取前10最高频的词
    print (word_counts_top20) # 输出检查
    print('---------------------------分割线----------------------')
    n = word_counts_top20
    b = ['评论热词','热度']
    file_name = jiudian_index + '.csv'
    # 做词云图,先将储存代码注释起来
    with open(file_name,'w',newline='') as t:#numline是来控制空的行数的
        writer=csv.writer(t)#这一步是创建一个csv的写入器
        writer.writerow(b)#写入标签
        writer.writerows(n)#写入样本数据
    # 词频展示
    mask = np.array(Image.open('词云背景图1.jpg')) # 定义词频背景
    wc = wordcloud.WordCloud(
        font_path='C:/Windows/Fonts/simhei.ttf', # 设置字体格式
        mask=mask, # 设置背景图
        max_words=200, # 最多显示词数
        max_font_size=100 # 字体最大值
    )

    wc.generate_from_frequencies(word_counts) # 从字典生成词云
    image_colors = wordcloud.ImageColorGenerator(mask) # 从背景图建立颜色方案
    wc.recolor(color_func=image_colors) # 将词云颜色设置为背景图方案
    plt.imshow(wc) # 显示词云
    plt.axis('off') # 关闭坐标轴
    file_name_image = jiudian_index
    plt.savefig(file_name_image,dpi=500)
[('不错', 5), ('房间', 3), ('升级', 2), ('适合', 1), ('家庭', 1), ('出行', 1), ('延迟', 1), ('退房', 1), ('很赞', 1), ('几年', 1), ('广州', 1), ('每次', 1), ('住', 1), ('位置', 1), ('性价比', 1), ('免费', 1), ('前台', 1), ('很帅', 1), ('态度', 1), ('服务', 1)]
---------------------------分割线----------------------
[('服务', 517), ('不错', 297), ('前台', 185), ('房间', 142), ('入住', 117), ('早餐', 116), ('位置', 107), ('住', 97), ('环境', 75), ('深圳', 74), ('干净', 70), ('交通', 67), ('特别', 61), ('下次', 58), ('热情', 53), ('挺', 50), ('卫生', 49), ('性价比', 46), ('设施', 45), ('机场', 45)]
---------------------------分割线----------------------
[('服务', 575), ('不错', 285), ('前台', 230), ('环境', 172), ('房间', 170), ('服务态度', 141), ('大堂', 139), ('热情', 124), ('经理', 115), ('入住', 113), ('住', 92), ('早餐', 84), ('礼宾', 83), ('林先生', 75), ('下次', 73), ('干净', 69), ('卫生', 68), ('满意', 57), ('交通', 56), ('位置', 54)]
---------------------------分割线----------------------
[('服务', 301), ('不错', 291), ('温泉', 232), ('环境', 178), ('孩子', 151), ('房间', 136), ('早餐', 131), ('适合', 117), ('入住', 106), ('下次', 102), ('开心', 99), ('小朋友', 96), ('泳池', 91), ('特别', 84), ('亲子', 83), ('喜欢', 81), ('挺', 79), ('住', 77), ('设施', 76), ('体验', 71)]
---------------------------分割线----------------------
[('服务', 198), ('房间', 182), ('不错', 167), ('升级', 110), ('入住', 109), ('环境', 101), ('前台', 93), ('住', 86), ('广州', 83), ('老牌', 76), ('套房', 73), ('早餐', 70), ('五星', 68), ('五星级', 67), ('干净', 57), ('位置', 56), ('免费', 55), ('交通', 48), ('设施', 48), ('满意', 46)]
---------------------------分割线----------------------
[('服务', 431), ('温泉', 380), ('不错', 206), ('早餐', 158), ('房间', 156), ('环境', 141), ('孩子', 107), ('干净', 105), ('喜欢', 89), ('设施', 85), ('特别', 85), ('服务员', 82), ('感觉', 81), ('入住', 77), ('服务态度', 73), ('泡温泉', 66), ('下次', 66), ('小朋友', 66), ('体验', 63), ('工作人员', 61)]
---------------------------分割线----------------------
[('房间', 171), ('服务', 154), ('不错', 140), ('环境', 114), ('沙面', 95), ('住', 87), ('广州', 84), ('早餐', 82), ('入住', 77), ('江景', 76), ('位置', 72), ('早茶', 68), ('房', 61), ('老牌', 55), ('特别', 48), ('设施', 47), ('五星级', 46), ('棒', 46), ('珠江', 43), ('舒服', 43)]
---------------------------分割线----------------------
[('不错', 220), ('服务', 187), ('房间', 142), ('前台', 87), ('干净', 80), ('环境', 74), ('住', 70), ('性价比', 69), ('卫生', 62), ('服务态度', 62), ('推荐', 51), ('价格', 50), ('高', 49), ('位置', 45), ('下次', 41), ('挺', 40), ('早餐', 40), ('很大', 39), ('值得', 38), ('满意', 35)]
---------------------------分割线----------------------
[('不错', 206), ('早餐', 203), ('房间', 172), ('服务', 165), ('沙滩', 164), ('入住', 134), ('泳池', 118), ('孩子', 108), ('适合', 99), ('环境', 81), ('设施', 71), ('干净', 66), ('洲际', 61), ('住', 56), ('前台', 55), ('海景', 52), ('挺', 51), ('度假', 50), ('海滩', 46), ('特别', 44)]
---------------------------分割线----------------------
[('不错', 163), ('服务', 132), ('房间', 115), ('环境', 104), ('入住', 75), ('早餐', 74), ('住', 63), ('前台', 49), ('位置', 47), ('感觉', 43), ('海上', 41), ('世界', 41), ('海景', 39), ('喜欢', 39), ('升级', 36), ('设施', 35), ('体验', 35), ('下次', 35), ('特别', 32), ('干净', 32)]
---------------------------分割线----------------------
[('服务', 227), ('不错', 121), ('房间', 97), ('早餐', 96), ('前台', 92), ('孩子', 82), ('入住', 81), ('环境', 71), ('特别', 68), ('沙滩', 66), ('泳池', 61), ('下次', 57), ('喜欢', 49), ('位置', 48), ('洲际', 44), ('住', 44), ('设施', 42), ('很棒', 39), ('适合', 37), ('贴心', 37)]
---------------------------分割线----------------------
[('不错', 183), ('房间', 149), ('服务', 126), ('干净', 106), ('交通', 81), ('挺', 67), ('卫生', 66), ('位置', 62), ('地铁站', 61), ('环境', 61), ('住', 46), ('便利', 36), ('满意', 35), ('免费', 34), ('前台', 33), ('地铁', 32), ('价格', 30), ('周边', 30), ('服务态度', 30), ('特别', 29)]
---------------------------分割线----------------------
[('服务', 418), ('房间', 240), ('入住', 199), ('早餐', 175), ('经理', 167), ('特别', 136), ('不错', 134), ('住', 129), ('送', 115), ('贴心', 111), ('孩子', 107), ('下次', 104), ('大桥', 98), ('升级', 96), ('环境', 91), ('体验', 86), ('位置', 85), ('真的', 83), ('前台', 76), ('港珠澳', 75)]
---------------------------分割线----------------------
[('不错', 151), ('服务', 120), ('房间', 96), ('住', 74), ('早餐', 70), ('交通', 64), ('位置', 58), ('入住', 56), ('广州', 53), ('环境', 50), ('干净', 48), ('老牌', 45), ('舒服', 39), ('前台', 37), ('设施', 37), ('卫生', 36), ('宾馆', 32), ('性价比', 30), ('感觉', 29), ('挺', 26)]
---------------------------分割线----------------------
[('房间', 305), ('服务', 250), ('不错', 232), ('环境', 142), ('干净', 137), ('前台', 136), ('设施', 134), ('早餐', 125), ('大堂', 113), ('入住', 112), ('齐全', 102), ('免费', 100), ('很大', 90), ('挺', 88), ('阳台', 87), ('热情', 79), ('舒服', 74), ('特别', 72), ('卫生', 70), ('经理', 69)]
---------------------------分割线----------------------
[('不错', 221), ('前台', 178), ('服务', 155), ('房间', 84), ('服务态度', 80), ('环境', 70), ('推荐', 69), ('小姐姐', 63), ('入住', 56), ('热情', 54), ('干净', 51), ('值得', 47), ('位置', 37), ('服务员', 35), ('舒适', 34), ('住', 34), ('好好', 33), ('卫生', 31), ('性价比', 29), ('挺', 28)]
---------------------------分割线----------------------
[('不错', 149), ('服务', 119), ('房间', 109), ('早餐', 93), ('位置', 56), ('环境', 54), ('入住', 53), ('住', 45), ('挺', 40), ('前台', 40), ('设施', 39), ('干净', 36), ('广州', 34), ('下次', 31), ('感觉', 28), ('好好', 27), ('特别', 25), ('交通', 25), ('舒适', 25), ('满意', 23)]
---------------------------分割线----------------------
[('不错', 173), ('房间', 132), ('早餐', 127), ('位置', 90), ('服务', 89), ('住', 58), ('入住', 57), ('环境', 51), ('设施', 46), ('前台', 43), ('花城', 30), ('挺', 30), ('干净', 30), ('广州', 30), ('舒服', 29), ('广场', 28), ('还好', 26), ('说', 25), ('交通', 24), ('感觉', 23)]
---------------------------分割线----------------------
[('机场', 128), ('不错', 100), ('服务', 85), ('早餐', 68), ('房间', 53), ('航站楼', 43), ('环境', 42), ('入住', 41), ('位置', 40), ('干净', 39), ('T', 39), ('好好', 38), ('飞机', 37), ('住', 28), ('转机', 27), ('选择', 26), ('挺', 26), ('疫情', 24), ('免费', 23), ('卫生', 22)]
---------------------------分割线----------------------
[('干净', 216), ('房间', 190), ('服务', 180), ('前台', 137), ('不错', 136), ('环境', 129), ('设施', 100), ('推荐', 92), ('卫生', 81), ('位置', 76), ('舒服', 75), ('特别', 65), ('住', 63), ('热情', 63), ('新', 60), ('早餐', 56), ('性价比', 54), ('健身房', 54), ('齐全', 53), ('挺', 50)]
---------------------------分割线----------------------
[('不错', 124), ('位置', 91), ('服务', 86), ('房间', 83), ('早餐', 73), ('交通', 47), ('干净', 36), ('住', 36), ('地理位置', 34), ('环境', 33), ('入住', 32), ('性价比', 30), ('前台', 30), ('挺', 30), ('出差', 28), ('便利', 27), ('设施', 25), ('周边', 23), ('特别', 23), ('购物', 23)]
---------------------------分割线----------------------
[('服务', 199), ('前台', 150), ('不错', 127), ('房间', 57), ('挺', 50), ('礼宾', 48), ('位置', 38), ('工号', 37), ('下次', 34), ('入住', 34), ('服务态度', 32), ('住', 32), ('五星', 32), ('升级', 28), ('早餐', 26), ('环境', 26), ('热情', 25), ('特别', 24), ('性价比', 22), ('干净', 21)]
---------------------------分割线----------------------
[('服务', 203), ('房间', 110), ('不错', 74), ('服务态度', 72), ('干净', 53), ('前台', 48), ('热情', 41), ('环境', 39), ('服务员', 38), ('早餐', 37), ('卫生', 36), ('免费', 31), ('入住', 31), ('舒适', 30), ('停车', 29), ('停车场', 29), ('升级', 25), ('特别', 25), ('很大', 23), ('住', 22)]
---------------------------分割线----------------------
[('不错', 130), ('服务', 120), ('房间', 94), ('早餐', 91), ('位置', 81), ('世界之窗', 68), ('前台', 57), ('住', 55), ('入住', 54), ('环境', 44), ('设施', 44), ('特别', 39), ('说', 37), ('经理', 33), ('欢乐谷', 32), ('保安', 32), ('干净', 30), ('卫生', 30), ('感觉', 30), ('交通', 26)]
---------------------------分割线----------------------
[('不错', 110), ('位置', 67), ('服务', 67), ('房间', 61), ('性价比', 52), ('住', 42), ('交通', 40), ('入住', 39), ('干净', 35), ('早餐', 34), ('环境', 34), ('设施', 31), ('华强北', 30), ('高', 29), ('卫生', 28), ('深圳', 26), ('老牌', 25), ('五星', 23), ('挺', 23), ('特别', 19)]
---------------------------分割线----------------------
[('不错', 127), ('服务', 116), ('房间', 77), ('前台', 68), ('早餐', 54), ('交通', 50), ('入住', 49), ('位置', 42), ('住', 40), ('设施', 36), ('出差', 32), ('经理', 32), ('便利', 30), ('环境', 29), ('性价比', 23), ('热情', 23), ('深圳', 22), ('感谢', 21), ('大堂', 21), ('感觉', 21)]
---------------------------分割线----------------------
[('房间', 167), ('不错', 127), ('服务', 102), ('小镇', 97), ('环境', 95), ('早餐', 95), ('欧洲', 63), ('适合', 60), ('入住', 55), ('设施', 51), ('升级', 47), ('很大', 43), ('感觉', 42), ('免费', 41), ('前台', 37), ('疫情', 37), ('住', 35), ('吃', 34), ('旧', 33), ('泳池', 33)]
---------------------------分割线----------------------
[('不错', 137), ('服务', 124), ('前台', 103), ('环境', 89), ('早餐', 81), ('房间', 72), ('泳池', 47), ('干净', 38), ('设施', 32), ('温泉', 32), ('卫生', 31), ('性价比', 29), ('旧', 26), ('挺', 23), ('服务态度', 20), ('空调', 19), ('安静', 18), ('升级', 18), ('挺不错', 17), ('满意', 17)]
---------------------------分割线----------------------
[('服务', 154), ('不错', 97), ('早餐', 94), ('干净', 77), ('前台', 70), ('房间', 61), ('环境', 50), ('住', 44), ('入住', 41), ('特别', 40), ('服务态度', 39), ('热情', 38), ('舒服', 37), ('挺', 34), ('下次', 33), ('卫生', 31), ('新', 29), ('清馨', 25), ('广州', 24), ('小姐姐', 23)]
---------------------------分割线----------------------
[('服务', 154), ('不错', 115), ('房间', 94), ('干净', 70), ('前台', 67), ('早餐', 63), ('环境', 60), ('入住', 44), ('热情', 39), ('卫生', 38), ('挺', 36), ('性价比', 31), ('服务态度', 30), ('位置', 30), ('住', 27), ('下次', 27), ('交通', 27), ('出差', 27), ('安静', 25), ('舒适', 25)]
---------------------------分割线----------------------
[('不错', 108), ('房间', 74), ('服务', 72), ('早餐', 55), ('位置', 51), ('住', 46), ('入住', 41), ('设施', 33), ('前台', 29), ('挺', 29), ('好好', 27), ('广州', 26), ('舒服', 26), ('交通', 25), ('地理位置', 25), ('环境', 23), ('干净', 20), ('性价比', 19), ('五星', 18), ('很大', 18)]
---------------------------分割线----------------------
[('服务', 194), ('房间', 192), ('不错', 170), ('机场', 164), ('入住', 106), ('干净', 92), ('接送', 91), ('前台', 90), ('免费', 71), ('热情', 66), ('卫生', 63), ('公寓', 58), ('住', 55), ('早餐', 54), ('很大', 53), ('高', 51), ('性价比', 48), ('升级', 45), ('环境', 45), ('下次', 43)]
---------------------------分割线----------------------
[('房间', 110), ('不错', 102), ('服务', 72), ('环境', 62), ('早餐', 55), ('设施', 45), ('住', 43), ('位置', 42), ('交通', 36), ('老牌', 34), ('入住', 30), ('下次', 27), ('广州', 25), ('前台', 25), ('干净', 25), ('卫生', 22), ('性价比', 22), ('五星级', 22), ('服务态度', 21), ('五星', 21)]
---------------------------分割线----------------------
[('房间', 182), ('服务', 162), ('不错', 156), ('前台', 130), ('入住', 98), ('早餐', 93), ('住', 86), ('环境', 76), ('设施', 66), ('升级', 64), ('干净', 58), ('热情', 51), ('下次', 49), ('卫生', 42), ('位置', 40), ('免费', 39), ('舒服', 37), ('齐全', 35), ('满意', 35), ('服务态度', 34)]
---------------------------分割线----------------------
[('服务', 87), ('不错', 81), ('房间', 71), ('干净', 66), ('舒服', 44), ('前台', 38), ('舒适', 35), ('住', 35), ('环境', 35), ('卫生', 32), ('挺', 22), ('满意', 19), ('服务态度', 19), ('新', 18), ('入住', 18), ('停车场', 16), ('喜欢', 16), ('床', 15), ('这家', 15), ('下次', 14)]
---------------------------分割线----------------------
[('不错', 85), ('早餐', 77), ('房间', 65), ('位置', 62), ('环境', 47), ('服务', 41), ('住', 33), ('设施', 29), ('餐厅', 29), ('七星岩', 27), ('好好', 26), ('停车场', 25), ('干净', 25), ('很大', 24), ('旋转', 24), ('入住', 24), ('五星级', 20), ('卫生', 19), ('吃', 19), ('喜欢', 18)]
---------------------------分割线----------------------
[('服务', 121), ('房间', 74), ('不错', 72), ('环境', 51), ('住', 50), ('前台', 40), ('热情', 40), ('设施', 36), ('早餐', 35), ('lucky', 28), ('服务态度', 28), ('干净', 23), ('入住', 23), ('卫生', 22), ('下次', 17), ('升级', 17), ('感觉', 16), ('舒服', 16), ('位置', 15), ('楼', 14)]
---------------------------分割线----------------------
[('早餐', 99), ('不错', 94), ('房间', 91), ('设施', 88), ('沙滩', 72), ('环境', 63), ('服务', 54), ('入住', 44), ('泳池', 40), ('适合', 36), ('孩子', 34), ('住', 32), ('海滩', 31), ('位置', 28), ('干净', 28), ('前台', 27), ('挺', 27), ('游泳池', 26), ('吃', 24), ('旧', 24)]
---------------------------分割线----------------------
[('房间', 100), ('不错', 72), ('位置', 50), ('服务', 38), ('性价比', 38), ('设施', 35), ('北京路', 34), ('很大', 33), ('环境', 32), ('好好', 32), ('前台', 31), ('住', 31), ('交通', 30), ('旧', 29), ('入住', 28), ('免费', 26), ('早餐', 25), ('卫生', 23), ('干净', 23), ('广州', 20)]
---------------------------分割线----------------------
[('温泉', 133), ('早餐', 109), ('不错', 98), ('环境', 98), ('服务', 88), ('房间', 72), ('干净', 53), ('卫生', 43), ('入住', 38), ('送', 37), ('环境优美', 33), ('住', 32), ('满意', 31), ('餐厅', 30), ('服务员', 30), ('舒服', 30), ('吃', 29), ('下次', 29), ('感觉', 28), ('服务态度', 27)]
---------------------------分割线----------------------
[('温泉', 300), ('不错', 290), ('房间', 249), ('服务', 212), ('环境', 180), ('早餐', 154), ('前台', 103), ('挺', 103), ('入住', 95), ('干净', 93), ('感觉', 88), ('舒服', 85), ('特别', 83), ('地方', 76), ('真的', 75), ('舒适', 71), ('住', 71), ('很大', 64), ('泡温泉', 63), ('晚上', 62)]
---------------------------分割线----------------------
[('不错', 140), ('服务', 89), ('性价比', 42), ('房间', 41), ('好好', 41), ('早餐', 38), ('位置', 35), ('干净', 33), ('交通', 33), ('入住', 32), ('挺', 30), ('住', 30), ('前台', 28), ('卫生', 27), ('高', 26), ('价格', 21), ('环境', 21), ('出差', 20), ('送', 18), ('贴心', 17)]
---------------------------分割线----------------------
[('不错', 112), ('位置', 81), ('服务', 64), ('广州', 58), ('房间', 57), ('腰', 50), ('设施', 47), ('小蛮', 46), ('塔', 43), ('珠江', 38), ('环境', 35), ('性价比', 29), ('干净', 29), ('住', 29), ('入住', 28), ('早餐', 28), ('旧', 25), ('江景', 22), ('泳池', 22), ('卫生', 20)]
---------------------------分割线----------------------
[('服务', 123), ('前台', 109), ('不错', 79), ('房间', 75), ('环境', 49), ('位置', 47), ('服务态度', 33), ('住', 28), ('推荐', 27), ('设施', 26), ('入住', 26), ('免费', 25), ('值得', 25), ('满意', 25), ('卫生', 23), ('舒适', 23), ('交通', 22), ('性价比', 22), ('小姐姐', 20), ('干净', 19)]
---------------------------分割线----------------------
[('服务', 92), ('不错', 81), ('早餐', 49), ('赞赞', 27), ('干净', 24), ('工号', 24), ('房间', 21), ('好评', 20), ('前台', 19), ('服务态度', 18), ('环境', 18), ('热情', 16), ('挺', 11), ('棒棒', 10), ('赞', 10), ('卫生', 9), ('停车', 9), ('住', 8), ('位置', 8), ('感觉', 8)]
---------------------------分割线----------------------
[('服务', 85), ('不错', 75), ('房间', 38), ('前台', 33), ('安娜', 33), ('入住', 28), ('深圳', 28), ('出差', 27), ('交通', 27), ('位置', 26), ('环境', 25), ('服务态度', 23), ('干净', 23), ('住', 21), ('性价比', 20), ('早餐', 20), ('设施', 18), ('卫生', 16), ('舒适', 15), ('号', 15)]
---------------------------分割线----------------------
[('不错', 81), ('房间', 74), ('服务', 65), ('位置', 44), ('老牌', 39), ('住', 34), ('公园', 34), ('设施', 34), ('入住', 34), ('交通', 33), ('环境', 30), ('五星', 30), ('越秀', 29), ('早餐', 28), ('广州', 27), ('性价比', 25), ('感觉', 23), ('疫情', 22), ('五星级', 21), ('干净', 20)]
---------------------------分割线----------------------
[('服务', 107), ('不错', 63), ('卫生', 60), ('房间', 48), ('位置', 38), ('住', 26), ('干净', 26), ('环境', 21), ('前台', 20), ('地理位置', 19), ('挺', 19), ('交通', 18), ('服务态度', 18), ('性价比', 17), ('便利', 16), ('价格', 12), ('高', 12), ('下次', 12), ('推荐', 12), ('优越', 12)]
---------------------------分割线----------------------
[('服务', 83), ('不错', 76), ('前台', 60), ('早餐', 59), ('房间', 56), ('位置', 41), ('入住', 38), ('住', 30), ('特别', 28), ('感觉', 25), ('体验', 25), ('干净', 22), ('卫生', 22), ('很棒', 21), ('热情', 21), ('环境', 20), ('交通', 18), ('下次', 18), ('选择', 17), ('深圳', 17)]
---------------------------分割线----------------------
[('不错', 95), ('房间', 65), ('服务', 53), ('位置', 48), ('早餐', 45), ('设施', 39), ('交通', 35), ('干净', 33), ('汕头', 29), ('机场', 28), ('住', 27), ('环境', 25), ('卫生', 22), ('老牌', 21), ('性价比', 19), ('大巴', 19), ('地理位置', 18), ('五星级', 18), ('入住', 17), ('五星', 15)]
---------------------------分割线----------------------

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YAOx5aMa-1620232197725)(output_12_1.png)]

  • 13
    点赞
  • 74
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 12
    评论
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wency(王斯-CUEB)

我不是要饭的

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值