强大的Python分析5000+抖音大V,几行代码发现大家都喜欢这类视频【源码分享】

本文使用Python分析了5000+抖音大V的数据,发现新闻媒体、美食和娱乐类视频在点赞、分享方面表现突出。其中,美女、搞笑、游戏和剧情类视频最受用户喜爱。性别比例接近1:1,点赞破亿的大V有500多个,粉丝数在200w~500w区间的人数最多。
摘要由CSDN通过智能技术生成

最近,小F在知乎上看到一个关于抖音的问题。

里面提到了,目前我国人均每天刷短视频110分钟。

看这数据,看来小F又被平均了。

不过老实说,只要一打开抖音,小F确实是有一种停不下来的感觉~

所以还是少刷抖音,多看书。要不然时间全流逝了。

本期就给大家用数据分析一下在抖音,什么类型的视频最受欢迎。

/ 01 / 数据获取

数据来自于第三方监测,一共是有5000+抖音大V的数据信息。

文件我已上传,文末点击蓝色字体获取

主要包含大V们的昵称、性别、地点、类型、点赞数、粉丝数、视频数、评论数、分享数、关注数、毕业学校、认证、简介等信息。

其中粉丝最多的是「人民日报」,接近1.2亿。「央视新闻」也破亿了,记得之前破亿的时候还上过热搜~

粉丝最少的博主也有近150w+的粉丝,这5000多位大V累计236.5亿粉丝,地球人口的三倍多!

/ 02 / 数据可视化

导入相关库,然后读取数据。

from pyecharts.charts import Pie, Bar, TreeMap, Map, Geo from wordcloud import WordCloud, ImageColorGenerator from pyecharts import options as opts import matplotlib.pyplot as plt from PIL import Image import pandas as pd import numpy as np import jieba df = pd.read_csv('douyin.csv', header=0, encoding='utf-8-sig') print(df)

01 性别分布情况

整体上看,男女比例差别不大。

除去未知的数据,基本是1:1。

可视化代码如下。

def create_gender(df):
    df = df.copy()
    # 修改数值
    df.loc[df.gender == '0', 'gender'] = '未知'
    df.loc[df.gender == '1', 'gender'] = '男性'
    df.loc[df.gender == '2', 'gender'] = '女性'
    # 根据性别分组
    gender_message = df.groupby(['gender'])
    # 对分组后的结果进行计数
    gender_com = gender_message['gender'].agg(['count'])
    gender_com.reset_index(inplace=True)

    # 饼图数据
    attr = gender_com['gender']
    v1 = gender_com['count']

    # 初始化配置
    pie = Pie(init_opts=opts.InitOpts(width="800px", height="400px"))
    # 添加数据,设置半径
    pie.add("", [list(z) for z in zip(attr, v1)], radius=["40%", "75%"])
    # 设置全局配置项,标题、图例、工具箱(下载图片)
    pie.set_global_opts(title_opts=opts.TitleOpts(title="抖音大V性别分布情况", pos_left="center", pos_top="top"),
                        legend_opts=opts.LegendOpts(orient="vertical", pos_left="left"),
                        toolbox_opts=opts.ToolboxOpts(is_show=True, feature={"saveAsImage": {}}))
    # 设置系列配置项,标签样式
    pie.set_series_opts(label_opts=opts.LabelOpts(is_show=True, formatter="{b}:{d}%"))
    pie.render("抖音大V性别分布情况.html")
复制代码

02 点赞数

点赞数TOP10,除了「小团团」和「毒舌」,其他都是新闻媒体类的大V。

今年因为疫情,有很多新闻在抖音上都是第一时间传播,所以影响力比较大,点赞也就比较多了。

记得「四川观察」还被评论区调侃为四处观察,意思是发布消息非常快。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值