B站主播投稿视频数据分析与tableau可视化——视频名称、简介、弹幕数、点赞数、收藏数、转发数、投币数等分析

最新推荐文章于 2023-10-30 16:12:16 发布

Pumpkin9913

最新推荐文章于 2023-10-30 16:12:16 发布

阅读量5.7k

点赞数 6

文章标签：大数据游戏 mysql 运维数据挖掘

本文链接：https://blog.csdn.net/weixin_43162364/article/details/107249745

版权

本文通过爬取B站OldBa1的视频数据，分析播放量、点赞、收藏等关键指标，并用Tableau进行可视化。数据显示，播放量与互动率对视频推广至关重要，尤其是第五人格、甜蜜之家、魔人、原神和动物之森等主题视频。互动数据如投币率、点赞率和转发率揭示了视频受欢迎程度和粉丝粘性。2020年，其他类视频数量和互动指标显著上升，显示出新的发展方向。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在短视频运营中，数据分析这一环节是非常重要的，要去观察数据背后的现象，这样有利于我们对视频内容的调整，优化有一个指导性的作用。

本文爬取b站主播OldBa1的投稿视频数据，包括视频名称、简介、弹幕数、点赞数、收藏数、转发数、投币数等，并据此计算相应比率，根据视频主题和时间进行分类可视化，分析其转型可能性及方向。

数据获取与简介

本文数据是从b站爬取，本人爬虫经验不足，爬虫的部分，参考了爬取b站视频的名称、地址、简介、观看次数、弹幕数量及发布时间并保存为csv文件的方法并稍作修改。
代码如下，具体不再介绍。

import requests
from bs4 import BeautifulSoup
import pandas as pd
import re
import time
from urllib import request
import json
import importlib,sys
importlib.reload(sys)

alphabet = 'fZodR9XQDSUm21yCkr6zBqiveYah8bt4xsWpHnJE7jL5VG3guMTKNPAwcF'
def dec(x):#BV号转换成AV号
    r = 0
    for i, v in enumerate([11, 10, 3, 8, 4, 6]):
        r += alphabet.find(x[v]) * 58**i
    return (r - 0x2_0840_07c0) ^ 0x0a93_b324


def crawl():#获取每个视频的html文本
    htmls = [] # 存放每个页面的HTML
    # 用for循环爬取每一个页面并获得其HTML
    for i in range(50):
        # 用f+字符串来表示每一个页面的网址
        url = f"https://search.bilibili.com/all?keyword=oldba1&from_source=nav_search&spm_id_from=333.851.b_696e7465726e6174696f6e616c486561646572.11&page={str(int(i+1))}"
        r = requests.get(url) # 返回Response对象
        if r.status_code != 200: # 状态码检测
            raise Exception("error")
        htmls.append(r.text) # r.text是字符串类型

    return htmls

def parse(htmls): #对html文本进行解析
    videos = [] # 存放每个视频解析出来的HTML
    print('解析页面中……')
    for html in htmls:
        soup = BeautifulSoup

最低0.47元/天解锁文章