Python告诉你：李子柒的视频都在拍些什么？

2401_84010326

于 2024-04-08 02:21:27 发布

阅读量946

点赞数 15

分类专栏：程序员文章标签： python 信息可视化数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84010326/article/details/137485647

版权

程序员专栏收录该内容

237 篇文章

订阅专栏

文章讲述了使用Python对B站上李子柒的125个视频进行数据分析，包括视频内容类型、观看量、互动指标等，揭示了她的视频为何如此受欢迎。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者：CDA数据分析师

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

“李家有女，人称子柒。”如果说到当下最火的网红，想必很多人都会想到李子柒。

日出而作，日落而息，看似平淡无奇的日子，李子柒却总能过成一首诗、一幅画。

三月桃花熟了，采来酿桃花酒。四月枇杷成熟，酿枇杷酒…随着不同时令季节，做出不同的美食，看过李子柒视频的人，无一不对那视频里的古风田园生活向往憧憬着，同时也带给了无数人治愈的力量。

目前在B站上，李子柒共有579万的粉丝。入驻到现在仅仅发布了共125条视频，但随便翻翻视频列表，几乎每个视频都是爆款。

在这里插入图片描述

教你用Python分析

李子柒的视频都在拍些什么？

下面让我们看到关键的分析步骤：

我们Python获取了B站上李子柒发布的125个视频相关信息，进行了以下分析，分析流程如下：

数据读入
数据清洗
数据可视化
数据读入

首先读入分析所用的数据集，本数据集一共包含125个样本，11个字段，字段含义为：视频标题、一级分类、二级分类、发布时间、最高全站排名、总播放数、历史累计弹幕、点赞、投币、收藏和分享数。

数据预览如下：

导入包

import numpy as np

import pandas as pd

import re

读入数据

df = pd.read_excel(‘./data/李子柒视频数据.xlsx’)

df.head()

在这里插入图片描述

数据清洗

此部分我们初步对以下信息进行简单的处理，其中包含：

title：提取主题和介绍
top_rank：提取数值
view_num：提取数值
dm_num: 提取数值
dianzan: 计算数值
toubi: 计算数值
shoucang：计算数值
zhuanfa：计算数值

定义转换函数

def transform_num(x):

str1 = str(x)

if ‘万’ in str1:

return float(str1.strip(‘万’))*10000

else:

return float(str1)

提取数据

df[‘title_1’] = df.title.str.extract(‘【(.?)】.’)

df[‘title_2’] = df.title.str.split(‘】’).str[-1]

df[‘top_rank’] = df.top_rank.str.extract(‘最高全站日排行(\d+)名’)

df[‘view_num’] = df.view_num.str.extract(‘(\d+)’)

df[‘dm_num’] = df.dm_num.str.extract(‘(\d+)’)

df[‘dianzan’] = df.dianzan.apply(lambda x: transform_num(x))

df[‘toubi’] = df.toubi.apply(lambda x: transform_num(x))

df[‘shoucang’] = df.shoucang.apply(lambda x: transform_num(x))

df[‘zhuanfa’] = df.zhuanfa.apply(lambda x: transform_num(x))

转换类型

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数Python工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Python开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上前端开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以扫码获取！！！（备注Python）

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上前端开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以扫码获取！！！（备注Python）

博客等级

码龄1年

237
原创

3300
点赞

3523
收藏

2398
粉丝

关注

私信

热门文章

分类专栏

程序员 237篇

最新评论

Python 情人节超强技能导出微信聊天记录生成词云(1)
2501_91832900: lovers_chat_generator.p imort os import zipfile import random from dateime import datetime, timelta base_dir = "love_chat" os.makirs(f"{base_dir}/text", exit_ok=True) urs = ["邵薇", "人X", # 词库 love_phrases = [ ("我想你了", ["💘", "🌙", ""]), ("你在想我吗？", ["😢", "💔", "(深夜)"]), ("输入中...", []), ("对方撤回了一条消息", []), ("[图片]", []), ("[语音消息]", []), ("你睡了么？", ["🌃", "⏰21:21"]), ("还记得那天吗？", ["🍂", "2024.09"]), ("特别关心提示", []), ("对方正在输入...", []) ] def geerate_love_message(): if random.ranm() < 0.3: base, decorations = ranm.choi(love_phrases[:8]) retun f"{base} {randm.choice(decorions)}".strip() retn ranom.chce([ "我想你了", "你想我吗？", "心里空空的", "特别关心提醒", "窗口震动提醒", "位置共享请求", "晚安...又失眠了", "您有一条未读消息", "[文件] memories.zip" ]) # timestamp = datetime.now() - timedelta(days=365*2) timeline = [] for _ in range(50): timestamp += timedelta(seconds=random.randint(10, 3600*6)) if 0 <= timestamp.hou
论文笔记（5）Dynamic Trust-Based Device Legitimacy Assessment Towards Secure IoT Interactions
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。