收集整理了一份《2024年最新Python全套学习资料》免费送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Python知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来
如果你需要这些资料,可以添加V无偿获取:hxbc188 (备注666)
正文
01 性别分布情况
整体上看,男女比例差别不大。
除去未知的数据,基本是1:1。
可视化代码如下。
def create_gender(df):
df = df.copy()
# 修改数值
df.loc[df.gender == ‘0’, ‘gender’] = ‘未知’
df.loc[df.gender == ‘1’, ‘gender’] = ‘男性’
df.loc[df.gender == ‘2’, ‘gender’] = ‘女性’
# 根据性别分组
gender_message = df.groupby([‘gender’])
# 对分组后的结果进行计数
gender_com = gender_message[‘gender’].agg([‘count’])
gender_com.reset_index(inplace=True)
# 饼图数据
attr = gender_com[‘gender’]
v1 = gender_com[‘count’]
# 初始化配置
pie = Pie(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
# 添加数据,设置半径
pie.add(“”, [list(z) for z in zip(attr, v1)], radius=[“40%”, “75%”])
# 设置全局配置项,标题、图例、工具箱(下载图片)
pie.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V性别分布情况”, pos_left=“center”, pos_top=“top”),
legend_opts=opts.LegendOpts(orient=“vertical”, pos_left=“left”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}))
# 设置系列配置项,标签样式
pie.set_series_opts(label_opts=opts.LabelOpts(is_show=True, formatter=“{b}:{d}%”))
pie.render(“抖音大V性别分布情况.html”)
02 点赞数
点赞数TOP10,除了「小团团」和「毒舌」,其他都是新闻媒体类的大V。
今年因为疫情,有很多新闻在抖音上都是第一时间传播,所以影响力比较大,点赞也就比较多了。
记得「四川观察」还被评论区调侃为四处观察,意思是发布消息非常快。
好奇为什么会有100万点赞数的大V,小F的抖音号都有20w+的赞。
最后发现是第三方监测收录的问题,下次可以直接剔除这批数据。
点赞破亿的有500多个大V,1000万到5000万点赞数的大V人数最多。
可视化代码如下。
def create_likes(df):
# 排序,降序
df = df.sort_values(‘likes’, ascending=False)
# 获取TOP10的数据
attr = df[‘name’][0:10]
v1 = [float(‘%.1f’ % (float(i) / 100000000)) for i in df[‘likes’][0:10]]
# 初始化配置
bar = Bar(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
# x轴数据
bar.add_xaxis(list(reversed(attr.tolist())))
# y轴数据
bar.add_yaxis(“”, list(reversed(v1)))
# 设置全局配置项,标题、工具箱(下载图片)、y轴分割线
bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V点赞数TOP10(亿)”, pos_left=“center”, pos_top=“18”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
xaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))
# 设置系列配置项,标签样式
bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“right”, color=“black”))
bar.reversal_axis()
bar.render(“抖音大V点赞数TOP10(亿).html”)
def create_cut_likes(df):
# 将数据分段
Bins = [0, 1000000, 5000000, 10000000, 25000000, 50000000, 100000000, 5000000000]
Labels = [‘0-100’, ‘100-500’, ‘500-1000’, ‘1000-2500’, ‘2500-5000’, ‘5000-10000’, ‘10000以上’]
len_stage = pd.cut(df[‘likes’], bins=Bins, labels=Labels).value_counts().sort_index()
# 获取数据
attr = len_stage.index.tolist()
v1 = len_stage.values.tolist()
# 生成柱状图
bar = Bar(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
bar.add_xaxis(attr)
bar.add_yaxis(“”, v1)
bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V点赞数分布情况(万)”, pos_left=“center”, pos_top=“18”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
yaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))
bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“top”, color=“black”))
bar.render(“抖音大V点赞数分布情况(万).html”)
03 粉丝数
「人民日报」和「央视新闻」粉丝都破亿了。
和去年的抖音数据一对比,「热巴」还少了几十万的粉丝,陈赫倒是涨了不少粉丝。
今年直播带货火热,李佳琦排入前十,也不足为奇,毕竟带货一哥。
再来看一下大V们粉丝数的分布情况。
5000万以上56个,妥妥的大佬。
200w~500w的人数最多,好多一时爆火的博主,一段时间后也基本不怎么涨粉了。
可能都停留到了这里,比如小F以前刷过的「三支花」,想不明白这都能火…
这里的可视化代码和上面差不多,就不放出来了。
公众号回复「抖音」,即可获取完整代码!
04 评论数TOP10****
抖音视频的评论区也是比较有意思的地方。
比如刷剧催更的,「赶紧去更新,都过了十几分钟了,生产队的驴都不敢休息这么久」。
还有五只疯狂摇头的猫,也占领了评论区一段时间。
小F只能说,太魔性了~
总的来说,媒体类的视频评论较多。
05 分享数TOP10****
抖音的分享是视频对外传播的一个方法,可以让更多的人看到视频。
从数据上看,大家还是比较喜欢分享新闻类以及美食类的视频。
可能过年疫情,居家一个月的时间,除了葛优躺看新闻,就是吃吃吃。
每个人,也就都有了一个成为大厨的梦想。
06 各类型点赞数/粉丝数汇总分布图
记得曾经一位大佬说过,抖音这个产品是消磨你时间的(Kill Time),而不是节约时间(Save Time),技术稍微深一点的视频基本上生存不下去。
由上面的矩形树图可以知道,大家都喜欢「美女」类型的视频,毕竟谁不喜欢漂亮妹子呢~
比如说深情看铜人的妹子、高考送满天星的妹子,刀小刀等等,妹子爆火的视频太多了…
另外「搞笑」、「游戏」、「剧情」类的视频也比较吸引人,妥妥的Kill Time。
可视化代码如下。
def create_type_likes(df):
# 分组求和
likes_type_message = df.groupby([‘category’])
likes_type_com = likes_type_message[‘likes’].agg([‘sum’])
likes_type_com.reset_index(inplace=True)
# 处理数据
dom = []
for name, num in zip(likes_type_com[‘category’], likes_type_com[‘sum’]):
data = {}
data[‘name’] = name
data[‘value’] = num
dom.append(data)
print(dom)
# 初始化配置
treemap = TreeMap(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
# 添加数据
treemap.add(‘’, dom)
# 设置全局配置项,标题、工具箱(下载图片)
treemap.set_global_opts(title_opts=opts.TitleOpts(title=“各类型抖音大V点赞数汇总图”, pos_left=“center”, pos_top=“5”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
legend_opts=opts.LegendOpts(is_show=False))
treemap.render(“各类型抖音大V点赞数汇总图.html”)
07 平均视频点赞数/粉丝数TOP10
「李现」作为2019年的顶级流量,登顶第一,没啥问题。
其他的博主小F一个也没关注过。
去搜索了一下,发现大部分账号只有一两个视频。
看了评论区,发现原来号被卖掉了,有可能是大V和公司分手了,毕竟现在好多做网红的公司,不火就下一位。
另一种就是个人转让账号,变现赚钱跑路咯。
可视化代码如下。
def create_avg_likes(df):
# 筛选
df = df[df[‘videos’] > 0]
# 计算单个视频平均点赞数
df.eval(‘result = likes/(videos*10000)’, inplace=True)
df[‘result’] = df[‘result’].round(decimals=1)
df = df.sort_values(‘result’, ascending=False)
# 取TOP10
attr = df[‘name’][0:10]
v1 = [‘%.1f’ % (float(i)) for i in df[‘result’][0:10]]
# 初始化配置
bar = Bar(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
# 添加数据
bar.add_xaxis(list(reversed(attr.tolist())))
bar.add_yaxis(“”, list(reversed(v1)))
# 设置全局配置项,标题、工具箱(下载图片)、y轴分割线
bar.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V平均视频点赞数TOP10(万)”, pos_left=“center”, pos_top=“18”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
xaxis_opts=opts.AxisOpts(splitline_opts=opts.SplitLineOpts(is_show=True)))
# 设置系列配置项
bar.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position=“right”, color=“black”))
# 翻转xy轴
bar.reversal_axis()
bar.render(“抖音大V平均视频点赞数TOP10(万).html”)
08 抖音大V分布情况
可以看出西藏一个大V都没有,所以没有颜色。
广东、浙江、四川位列前三。
可视化代码如下。
def create_province_map(df):
# 筛选数据
df = df[df[“country”] == “中国”]
df1 = df.copy()
# 数据替换
df1[“province”] = df1[“province”].str.replace(“省”, “”).str.replace(“壮族自治区”, “”).str.replace(“维吾尔自治区”, “”).str.replace(“自治区”, “”)
# 分组计数
df_num = df1.groupby(“province”)[“province”].agg(count=“count”)
df_province = df_num.index.values.tolist()
df_count = df_num[“count”].values.tolist()
# 初始化配置
map = Map(init_opts=opts.InitOpts(width=“800px”, height=“400px”))
# 中国地图
map.add(“”, [list(z) for z in zip(df_province, df_count)], “china”)
# 设置全局配置项,标题、工具箱(下载图片)、颜色图例
map.set_global_opts(title_opts=opts.TitleOpts(title=“抖音大V省份分布情况”, pos_left=“center”, pos_top=“0”),
toolbox_opts=opts.ToolboxOpts(is_show=True, feature={“saveAsImage”: {}}),
# 设置数值范围0-600,is_piecewise标签值连续
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、学习软件
工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
三、全套PDF电子书
书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。
四、入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
五、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
六、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
如果你需要这些资料,可以添加V无偿获取:hxbc188 (备注666)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
用到实际当中去,这时候可以搞点实战案例来学习。
六、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
如果你需要这些资料,可以添加V无偿获取:hxbc188 (备注666)
[外链图片转存中…(img-81rjvQkc-1713841450406)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!