Python分析5000+抖音大V,发现大家都喜欢这类视频!

现在能在网上找到很多很多的学习资源,有免费的也有收费的,当我拿到1套比较全的学习资源之前,我并没着急去看第1节,我而是去审视这套资源是否值得学习,有时候也会去问一些学长的意见,如果可以之后,我会对这套学习资源做1个学习计划,我的学习计划主要包括规划图和学习进度表。

分享给大家这份我薅到的免费视频资料,质量还不错,大家可以跟着学习

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

attr = len_stage.index.tolist()

v1 = len_stage.values.tolist()

# 生成柱状图

bar = Bar(init_opts=opts.InitOpts(width=“800px”, height=“400px”))

bar.add_xaxis(attr)

bar.add_yaxis(“”, v1)

bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V点赞数分布情况(万)”, pos_left=“center”, pos_top=“18”),

toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),

yaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))

bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“top”, color=“black”))

bar.render(“抖音大V点赞数分布情况(万).html”)

03 粉丝数

「人民日报」和「央视新闻」粉丝都破亿了。

和去年的抖音数据一对比,「热巴」还少了几十万的粉丝,陈赫倒是涨了不少粉丝。

今年直播带货火热,李佳琦排入前十,也不足为奇,毕竟带货一哥。

再来看一下大V们粉丝数的分布情况。

5000万以上56个,妥妥的大佬。

200w~500w的人数最多,好多一时爆火的博主,一段时间后也基本不怎么涨粉了。

可能都停留到了这里,比如小F以前刷过的「三支花」,想不明白这都能火…

这里的可视化代码和上面差不多,就不放出来了。

公众号回复「抖音」,即可获取完整代码!

04 评论数TOP10****

抖音视频的评论区也是比较有意思的地方。

比如刷剧催更的,「赶紧去更新,都过了十几分钟了,生产队的驴都不敢休息这么久」。

还有五只疯狂摇头的猫,也占领了评论区一段时间。

小F只能说,太魔性了~

总的来说,媒体类的视频评论较多。

05 分享数TOP10****

抖音的分享是视频对外传播的一个方法,可以让更多的人看到视频。

从数据上看,大家还是比较喜欢分享新闻类以及美食类的视频。

可能过年疫情,居家一个月的时间,除了葛优躺看新闻,就是吃吃吃。

每个人,也就都有了一个成为大厨的梦想。

06 各类型点赞数/粉丝数汇总分布图

记得曾经一位大佬说过,抖音这个产品是消磨你时间的(Kill Time),而不是节约时间(Save Time),技术稍微深一点的视频基本上生存不下去。

由上面的矩形树图可以知道,大家都喜欢「美女」类型的视频,毕竟谁不喜欢漂亮妹子呢~

比如说深情看铜人的妹子高考送满天星的妹子刀小刀等等,妹子爆火的视频太多了…

另外「搞笑」、「游戏」、「剧情」类的视频也比较吸引人,妥妥的Kill Time。

可视化代码如下。

def create_type_likes(df):

# 分组求和

likes_type_message = df.groupby([‘category’])

likes_type_com = likes_type_message[‘likes’].agg([‘sum’])

likes_type_com.reset_index(inplace=True)

# 处理数据

dom = []

for name, num in zip(likes_type_com[‘category’], likes_type_com[‘sum’]):

data = {}

data[‘name’] = name

data[‘value’] = num

dom.append(data)

print(dom)

# 初始化配置

treemap = TreeMap(init_opts=opts.InitOpts(width=“800px”, height=“400px”))

# 添加数据

treemap.add(‘’, dom)

# 设置全局配置项,标题、工具箱(下载图片)

treemap.set_global_opts(title_opts=opts.TitleOpts(title=“各类型抖音大V点赞数汇总图”, pos_left=“center”, pos_top=“5”),

toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),

legend_opts=opts.LegendOpts(is_show=False))

treemap.render(“各类型抖音大V点赞数汇总图.html”)

07 平均视频点赞数/粉丝数TOP10

李现」作为2019年的顶级流量,登顶第一,没啥问题。

其他的博主小F一个也没关注过。

去搜索了一下,发现大部分账号只有一两个视频。

看了评论区,发现原来号被卖掉了,有可能是大V和公司分手了,毕竟现在好多做网红的公司,不火就下一位。

另一种就是个人转让账号,变现赚钱跑路咯。

可视化代码如下。

def create_avg_likes(df):

# 筛选

df = df[df[‘videos’] > 0]

# 计算单个视频平均点赞数

df.eval(‘result = likes/(videos*10000)’, inplace=True)

df[‘result’] = df[‘result’].round(decimals=1)

df = df.sort_values(‘result’, ascending=False)

# 取TOP10

attr = df[‘name’][0:10]

v1 = [‘%.1f’ % (float(i)) for i in  df[‘result’][0:10]]

# 初始化配置

bar = Bar(init_opts=opts.InitOpts(width=“800px”, height=“400px”))

# 添加数据

bar.add_xaxis(list(reversed(attr.tolist())))

bar.add_yaxis(“”, list(reversed(v1)))

# 设置全局配置项,标题、工具箱(下载图片)、y轴分割线

bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V平均视频点赞数TOP10(万)”, pos_left=“center”, pos_top=“18”),

toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),

xaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))

# 设置系列配置项

bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“right”, color=“black”))

# 翻转xy轴

bar.reversal_axis()

bar.render(“抖音大V平均视频点赞数TOP10(万).html”)

08 抖音大V分布情况

可以看出西藏一个大V都没有,所以没有颜色。

广东、浙江、四川位列前三。

可视化代码如下。

def create_province_map(df):

# 筛选数据

df = df[df[“country”] == “中国”]

df1 = df.copy()

# 数据替换

df1[“province”] = df1[“province”].str.replace(“省”, “”).str.replace(“壮族自治区”, “”).str.replace(“维吾尔自治区”, “”).str.replace(“自治区”, “”)

# 分组计数

df_num = df1.groupby(“province”)[“province”].agg(count=“count”)

df_province = df_num.index.values.tolist()

df_count = df_num[“count”].values.tolist()

# 初始化配置

map = Map(init_opts=opts.InitOpts(width=“800px”, height=“400px”))

# 中国地图

map.add(“”, [list(z) for z in zip(df_province, df_count)], “china”)

# 设置全局配置项,标题、工具箱(下载图片)、颜色图例

map.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V省份分布情况”, pos_left=“center”, pos_top=“0”),

toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),

# 设置数值范围0-600,is_piecewise标签值连续

visualmap_opts=opts.VisualMapOpts(max_=600, is_piecewise=False))

map.render(“抖音大V省份分布情况.html”)

省份看完了,来看一下城市TOP10吧。

北京遥遥领先,大V的聚集地。

杭州盛产网红的城市,位列第二。

可视化代码如下。

def create_city(df):

df1 = df[df[“country”] == “中国”]

df1 = df1.copy()

df1[“city”] = df1[“city”].str.replace(“市”, “”)

df_num = df1.groupby(“city”)[“city”].agg(count=“count”).reset_index().sort_values(by=“count”, ascending=False)

df_city = df_num[:10][“city”].values.tolist()

df_count = df_num[:10][“count”].values.tolist()

bar = Bar(init_opts=opts.InitOpts(width=“800px”, height=“400px”))

bar.add_xaxis(df_city)

bar.add_yaxis(“”, df_count)

bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V城市分布TOP10”, pos_left=“center”, pos_top=“18”),

toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),

yaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))

bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“top”, color=“black”))

bar.render(“抖音大V城市分布TOP10.html”)

看完国内,就应该是国外了。

抖音上有着不少汉语讲得非常好的「歪果仁」。

美国居第一,不少在美国的华人会分享他们在美国生活的一些事情。

国内也有人感兴趣这方面的东西,看看国外的月亮究竟圆不圆。

哈哈说笑了,其实是让我们了解国外的生活。

09 抖音大V毕业学校TOP10

北影、中传、浙传、中戏、上戏、央美,妥妥的演艺圈大佬。

通过代码查询一下大V们的认证情况。

df1 = df[(df[“custom_verify”] != “”) & (df[“custom_verify”] != “未知”)]

df1 = df1.copy()

df_num = df1.groupby(“custom_verify”)[“custom_verify”].agg(count=“count”).reset_index().sort_values(by=“count”, ascending=False)

print(df_num[:20])

得到结果如下。

都是需要表演表达天赋的~

10 抖音大V简介词云

可以看到大部分大V都留下了商务合作的信息,利好内容创作者,如此才能双赢。

据统计,在抖音2200万以上创作者实现了超过417亿元的收入。

从创作到创益,这句话抖音讲的很好。

可视化代码如下。

def create_wordcloud(df, picture):

words = pd.read_csv(‘chineseStopWords.txt’, encoding=‘gbk’, sep=‘\t’, names=[‘stopword’])

# 分词

text = ‘’

df1 = df[df[“signature”] != “”]

df1 = df1.copy()

for line in df1[‘signature’]:

text += ’ '.join(jieba.cut(str(line).replace(" ", “”), cut_all=False))

# 停用词

stopwords = set(‘’)

stopwords.update(words[‘stopword’])

backgroud_Image = plt.imread(‘douyin.png’)

# 使用抖音背景色

alice_coloring = np.array(Image.open(r"douyin.png"))

image_colors = ImageColorGenerator(alice_coloring)

wc = WordCloud(

background_color=‘white’,

mask=backgroud_Image,

font_path=‘方正兰亭刊黑.TTF’,

max_words=2000,

max_font_size=70,

min_font_size=1,

prefer_horizontal=1,

color_func=image_colors,

random_state=50,

stopwords=stopwords,

margin=5

)

wc.generate_from_text(text)

# 看看词频高的有哪些

process_word = WordCloud.process_text(wc, text)

sort = sorted(process_word.items(), key=lambda e: e[1], reverse=True)

print(sort[:50])

plt.imshow(wc)

plt.axis(‘off’)

wc.to_file(picture)

print(‘生成词云成功!’)

/ 03 / 总结

好了,本期的文章到此就结束。

词云图不是太好看,下次试一下stylecloud库~

相关代码及文件我已上传公众号,回复「抖音」即可获取。

万水千山总是情,点个  ???  行不行。

推荐阅读(点击标题可跳转阅读)你知道全知乎阅读量最高的问题是什么吗?我全都爬下来了

最后

Python崛起并且风靡,因为优点多、应用领域广、被大牛们认可。学习 Python 门槛很低,但它的晋级路线很多,通过它你能进入机器学习、数据挖掘、大数据,CS等更加高级的领域。Python可以做网络应用,可以做科学计算,数据分析,可以做网络爬虫,可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多,你需要学好基础,再选择明确的方向。这里给大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

👉Python所有方向的学习路线👈

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

👉Python必备开发工具👈

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

👉Python全套学习视频👈

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

👉实战案例👈

学python就与学数学一样,是不能只看书不做题的,直接看步骤和答案会让人误以为自己全都掌握了,但是碰到生题的时候还是会一筹莫展。

因此在学习python的过程中一定要记得多动手写代码,教程只需要看一两遍即可。

👉大厂面试真题👈

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 16
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值