⚡一文告诉你蓬莱阁到底如何⚡

3 篇文章 1 订阅
1 篇文章 0 订阅


完成目标:
  获取评论并制作词云


一、前言

  毕竟会在烟台待上三年,先了解了解烟台这个地方。

二、环境准备

编辑器:pycharm

用到的库:requests、wordcloud、jieba

三、具体实现

1、短评游客评论并保存

  爬取去哪儿网关于蓬莱岛的游客评论的前20页

def save_comment():
    fp = open("comment.txt", mode="w", encoding="utf-8")
    for num in range(1, 20):
        url = 'https://piao.qunar.com/ticket/detailLight/sightCommentList.json?sightId=3827&index=' + str(
            num) + '&page=' + str(num) + '&pageSize=10&tagType=0'
        headers = {
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36 Edg/93.0.961.38',
            "accept": "application/json, text/javascript, */*; q=0.01",
        }
        response = requests.get(url=url, headers=headers)
        try:
            commentList = response.json()['data']['commentList']
            for comment in commentList:
                # content.append()
                fp.write(comment['content'] + "\n")
        except Exception as e:
            pass
    fp.close()

2、词云制作

  读取评论并制作词云

def stopwordslist(): # 停用词列表
    stopwords = [line.strip() for line in open('Chinesestopword.txt', encoding='UTF-8').readlines()]
    return stopwords

def get_wcd():
    fp = open("comment.txt", "r", encoding="utf-8")
    data = fp.read()
    stopwords=stopwordslist()
    data_list = jieba.lcut(data)
    data_list = " ".join(data_list)
    outstr = ''
    
    for word in data_list:
        if word not in stopwords:
            if word != '\t':
                outstr += word
                outstr += " "
                
    wcd = wordcloud.WordCloud(
        font_path="simkai.ttf"
        , colormap="brg"
        , width=800
        , height=400
        , max_words=200
        , background_color="white"
        , scale=16
    ).generate(outstr)
    
    wcd.to_file('comment.jpg')

3、成果

在这里插入图片描述

四、最后

  还是不错滴,有机会去~~~

  • 27
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 29
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 29
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值