Python分析5000+抖音大V,发现大家都喜欢这类视频

本文通过Python分析5000+抖音大V数据,揭示性别分布、点赞数、粉丝数等关键指标。发现新闻媒体类账号点赞多,男女比例接近,点赞破亿的大V占比高,而'美女'、'搞笑'、'游戏'、'剧情'类视频最受用户喜爱。
摘要由CSDN通过智能技术生成

写在前面

最近,我在知乎上看到一个关于抖音的问题。

里面提到了,目前我国人均每天刷短视频110分钟。

Python分析5000+抖音大V,发现大家都喜欢这类视频

1

看这数据,看来我又被平均了。

不过老实说,只要一打开抖音,确实是有一种停不下来的感觉~

所以还是少刷抖音,多看书,多写代码。要不然时间全流逝了。

私信小编01即可获取大量python学习资源

这次给大家用数据分析一下在抖音上,什么类型的视频最受欢迎。
Jupyter代码,数据可视化&分析

from pyecharts.charts import Pie, Bar, TreeMap, Map, Geofrom wordcloud import WordCloud, ImageColorGeneratorfrom pyecharts import options as optsfrom pyecharts.globals import ThemeTypeimport matplotlib.pyplot as pltfrom PIL import Imageimport pandas as pdimport numpy as npimport jieba

In [2]:

df = pd.read_csv('../file/douyin.csv',encoding = 'utf-8-sig')df.head()

Out[2]:

| |

name

|

gender

|

country

|

province

|

city

|

location

|

category

|

fans

|

videos

|

likes

|

comments

|

shares

|

following

|

school

|

custom_verify

|

enterprise_verify

|

signature

|
|

0

|

人民日报

|

0

|

中国

|

北京

|

北京

|

北京

|

政企

|

117259000

|

2427

|

1165446000

|

11906782048

|

9089061412

|

18

|

NaN

|

NaN

|

人民日报官方账号

|

参与、沟通、记录时代。

|
|

1

|

央视新闻

|

0

|

中国

|

北京

|

北京

|

北京

|

政企

|

105648000

|

3681

|

3814571666

|

2603872833

|

1989050522

|

27

|

NaN

|

央视新闻官方账号

|

央视新闻官方抖音号

|

本宝宝暂时还没想到个性签名

|
|

2

|

陈赫

|

1

|

中国

|

NaN

|

上海

|

上海

|

明星

|

68374000

|

422

|

570096000

|

430908721

|

117639297

|

131

|

上海戏剧学院

|

演员陈赫

|

NaN

|

帅到没朋友 ‍♂️有东西直播间 1⃣️1⃣️1⃣️8⃣️ ☑️公众号➰[陈赫]

|
|

3

|

Dear-迪丽热巴

|

0

|

NaN

|

NaN

|

NaN

|

NaN

|

明星

|

49790000

|

29

|

181167000

|

202448645

|

151645265

|

0

|

NaN

|

演员

|

NaN

|

NaN

|
|

4

|

毒舌电影

|

1

|

中国

|

广东

|

广州

|

广州

|

剧情

|

46355000

|

616

|

820393000

|

28026109

|

13005392

|

24

|

NaN

|

优质影视自媒体、抖音影评团成员

|

NaN

|

看电影, 可以改变人生。 商务邮:dsmovie@youhaoxi.cn ❤️ 日历预售…

|

In [27]:

df.loc[df.gender == '0', 'gender'] = '未知'df.loc[df.gender == '1', 'gender'] = '男性'df.loc[df.gender == '2', 'gender'] = '女性'# 根据性别分组gender_message = df.groupby(['gender'])# 对分组后的结果进行计数gender_com = gender_message['gender'].agg(['count'])gender_com.reset_index(inplace=True)# 饼图数据attr = gender_com['gender']v1 = gender_com['count']# 初始化配置pie = Pie(init_opts=opts.InitOpts(width="800px", height="400px",theme=ThemeType.LIGHT))# 添加数据,设置半径pie.add("", [list(z) for z in zip(attr, v1)], radius=["40%", "75%"])# 设置全局配置项,标题、图例、工具箱(下载图片)pie.set_global_opts(title_opts&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值