哔哩哔哩视频弹幕词云分析

在这里插入图片描述

import requests
import parsel
import csv
import time

for page in range(20,32):
    time.sleep(1)
    print('正在爬取'.format(page))
    url = 'https://api.bilibili.com/x/v2/dm/history?type=1&oid=140610898&date=2020-11-{}'.format(page)
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
        "cookie": "__uuid=1896D3F7-4A98-54EB-F7FA-3301CE9EF5F307776infoc; buvid3=B68B2187-4C3E-4466-A896-FBF9B292099B190963infoc; LIVE_BUVID=AUTO4115757254257055; stardustvideo=1; rpdid=|(umu|ulY)JJ0J'ul~l~klRJ); sid=8cq4r229; im_notify_type_65901796=0; laboratory=1-1; DedeUserID=523606542; DedeUserID__ckMd5=909861ec223d26d8; blackside_state=1; CURRENT_FNVAL=80; SESSDATA=a976c0b4%2C1618637313%2C4d792*a1; bili_jct=7f54729ec20660f750661122b80746d2; PVID=1; bp_video_offset_523606542=458111639975213216; CURRENT_QUALITY=16; bfe_id=1e33d9ad1cb29251013800c68af42315"
    }
    response = requests.get(url=url, headers=headers)
    response.encoding = response.apparent_encoding
    selector = parsel.Selector(response.text)
    data = selector.css('d::text').getall()
    print(data)
    for i in data:
        print(i)
        with open('B站弹幕.csv', mode='a', newline='', encoding='utf-8-sig') as f:
            writer = csv.writer(f)
            links = []
            links.append(i)
            writer.writerow(links)



import jieba
import wordcloud
import imageio
from PIL import Image
import numpy as np
# 读取文件内容
f = open('D:\python\爬虫\B站弹幕.csv', encoding='utf-8')#你文件存储的位置
txt = f.read()
# print(txt)
# jiabe 分词 分割词汇
txt_list = jieba.lcut(txt)
string = ' '.join(txt_list)
# 词云图设置
imgobj = Image.open('1.jpg')#你找的图片模型文件
img_mask=np.array(imgobj)
#print(img_mask)
wc = wordcloud.WordCloud(
        mask=img_mask,
        max_words=400,
        width=800,         # 图片的宽
        height=500,         # 图片的高
        background_color='snow',   # 图片背景颜色
        font_path='msyh.ttc',    # 词云字体
        random_state=120,
        max_font_size=60,
      
        scale=15,
)
# 给词云输入文字
wc.generate(string)
# 词云图保存图片地址
wc.to_file('1.png')
print("图片保存成功")
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 哔哩哔哩(Bilibili)是一个普遍受欢迎的弹幕视频网站,它汇集了大量的用户生成内容,包括视频、评论、弹幕等。因此,对哔哩哔哩上的数据进行分析,有助于了解网络文化、用户行为和消费习惯等方面的信息。此外,哔哩哔哩数据分析还可以为相关行业提供重要的决策参考,帮助他们更好地把握市场趋势,提高营销效果。因此,哔哩哔哩弹幕网站大数据分析研究具有广泛的应用前景。 ### 回答2: 哔哩哔哩弹幕网站作为中国热门的视频分享和社交平台,汇集了大量用户在观看视频时的评论弹幕。而这些弹幕不仅仅是简单的文字评论,更具有时间戳和位置信息,能够在视频播放过程中实时出现在视频画面上,为用户提供一种即时互动的形式。 哔哩哔哩弹幕网站的大数据分析研究背景主要体现在以下几个方面: 1. 用户行为分析:通过对用户在观看视频时的弹幕和互动行为进行分析,可以了解用户的兴趣偏好、观看习惯以及社交互动情况。这些分析结果能够帮助网站优化用户体验,提供更符合用户需求的内容和功能。 2. 视频内容分析:通过对用户在弹幕中的评论和观点进行分析,可以了解用户对于视频内容的评价、喜好以及热点话题。通过对这些分析结果的挖掘,可以为视频制作和推荐提供更准确的方向和决策依据。 3. 社会热点和舆情监测:哔哩哔哩弹幕网站拥有海量的用户和评论,其中包含了大量的社会热点、事件和话题。通过对弹幕数据的分析,可以及时了解到用户对于各种事件、社会问题的讨论和观点,从而帮助网站和相关企业进行舆情监测和管理。 4. 广告与粉丝经济研究:哔哩哔哩弹幕网站作为一个商业化平台,依靠广告和粉丝经济来实现盈利。通过对用户行为和弹幕数据的分析,可以深入了解用户对广告的反应和购买意愿,帮助广告商更准确地投放广告和定位用户。 总之,哔哩哔哩弹幕网站大数据分析研究能够从多个角度深入挖掘和理解用户行为、视频内容和社会热点,为网站优化、内容生产和商业运营提供科学可靠的依据。 ### 回答3: 哔哩哔哩弹幕网站是一家中国的弹幕视频分享网站,于2009年创建。弹幕视频指的是用户可以通过在视频上引入实时弹幕评论的方式进行互动观看的视频。随着互联网的快速发展,哔哩哔哩弹幕网站的用户数量和视频资源呈现快速增长的趋势,因此产生了大量的弹幕数据。 弹幕评论是用户在观看视频过程中实时输入的评论信息,这些评论可以包括对视频内容的评价、观点的交流、梗概、表情符号等。这些弹幕评论以文本的形式存在,仅依靠阅读和理解这些评论是很困难的。因此,哔哩哔哩弹幕网站的大数据分析研究背景是希望通过挖掘用户的弹幕评论,来了解用户对视频内容的看法和兴趣,进而提供个性化的视频推荐服务。 通过对哔哩哔哩弹幕网站的大数据进行分析和研究,可以帮助平台了解用户的兴趣和偏好,提升用户体验。同时,也可以为视频内容的创作者提供有价值的反馈,以改进和优化他们的创作。此外,大数据分析还可以帮助平台和广告主了解用户的消费行为和购买意向,从而提供更精准的广告投放。 除了对用户弹幕评论的分析哔哩哔哩弹幕网站的大数据还可以用于识别热门话题和趋势,帮助平台实时把握用户需求和市场动态,优化运营策略。大数据分析还可以用于监测和识别用户行为中的异常和违规行为,保障平台的安全和良好的用户环境。 综上所述,哔哩哔哩弹幕网站的大数据分析研究背景主要是基于用户的弹幕评论数据,通过挖掘和分析这些数据,可以帮助平台提供个性化的推荐服务、改善用户体验、优化运营策略和保障平台的安全。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

肥学

感谢支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值