我和关注我的前1000个粉丝“合影”啦,收集前1000个粉丝进行了一系列数据分析,收获满满

我们都知道在CSDN平台上博主与粉丝的互动是非常少的,不像B站抖音这些平台,CSDN粉丝数点赞数等数据相对非常低,这些现象产生的主要原因必然是因为平台的性质不同,面向对象不同。B站抖音偏娱乐休闲,大家自然更原因花多的时间在这上面,而CSDN作为一个学习平台,在数据量上很自然是比不过他们的(讲道理,有多少人喜欢学习胜过休闲娱乐呢)。

而我个人认为不仅仅是因为CSDN是一个学习平台,博主与粉丝相互之间缺少了解也占了很大一部分原因,这一点很难否认,因为相比于陌生人,大家都更愿意给有相识基础的人点赞。而同样的只有更了解受众的情况,博主才能更好地同粉丝进行互动。

所以如何才能更好地增加与粉丝的互动呢?从平台性质来看,我自然无能为力,同样我也不能指望着粉丝主动来了解我。所以目前我能做的,就只有试着去了解粉丝咯,了解关注我的人,究竟是什么人才!

注:以下分析使用的方法并不复杂,大家可以当作是我自己的一次小实验。

数据介绍

虽然现在关注我的人早已经超过1000了,但我觉得1000算是一个比较有意义的数字,所以我特意收集了关注我的前1000名朋友的信息,主要有以下两个部分:

  1. ID、关注日期
  2. ID、码龄、被访问量、原创文章、粉丝数量、点赞数、评论数、收藏数

之所以拆分成两部分呢,主要是因为这两部分收集的来源不同。

第一部分来源于:
在这里插入图片描述
收集到的数据如下所示:
在这里插入图片描述

第二部分来源于:
在这里插入图片描述

收集到的数据如下所示:
在这里插入图片描述

诶,如果我从粉丝页面收集了前1000个人的信息,那我从关注页面收集前1000个人的信息会是一样的吗??

答案是:NO!

因为有人脱粉了!!!(过分!)

这里可以先跟大家讲的是,我收集到的1081个关注信息中,有1000个粉丝关注着我,也就是说在这期间有81个粉丝“弃我而去”(文末我会“隆重介绍”他们)。

介绍完数据后,接下来我们就正式对这些数据进行分析啦!

从1到1000,我花了多长时间

具体计算方法如下:=MAX(B2:B1082)-MIN(B2:B1082))

在这里插入图片描述
如图,从第一个关注我的人,到第1000个粉丝,我用了586天的时间。其中最早有粉丝关注是在2019/12/22,第1000个粉丝的关注日期则是在2021/7/30。

第1个和第1000个关注我的粉丝

因为获取的时候是按关注顺序来收集的,所以得到结果比较简单。

在这里先要感谢一下我的第一个粉丝Kingforwise,万事开头难,有了第一个才会有第二个,所以我非常感谢Kingforwise这位朋友,感谢你的支持!

那么同时也要感谢l66yyy,非常刚好是我的第1000个粉丝,幸运!

粉丝数与日期之间的关系

在这里插入图片描述
在这里插入图片描述
从上图可以看到,我的粉丝增长主要是在今年才猛增的(毕竟今年更的比较多博客哈哈)

粉丝的码龄分布情况

说明:码龄不足1年的这里统一用0.5代替。
在这里插入图片描述
在这里插入图片描述
从在这里可以看到,关注我的朋友大多是码龄1-4年的,其中码龄最高的为21年。

粉丝的被访问量分布情况

在这里插入图片描述
在这里插入图片描述

由上图可以看到绝大多数粉丝的被访问量都为0。

我筛选出访问量小于200的数据做一个直方图,如下所示:
在这里插入图片描述

粉丝的被访问量分布情况

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
由上述图也不难发现,绝大多数朋友也不发博客。

粉丝的粉丝数量分布情况

在这里插入图片描述
在这里插入图片描述
从上图我们同样可以发现,绝大多数粉丝也是没有粉丝的,而其中只有两个粉丝的粉丝量破千,其中最高为1975。

粉丝的被点赞评论收藏数分布情况

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
其实从上述图片中我们同样不难发现,绝大多数朋友(93%以上)的数据都是0,而从点赞数和收藏数的平均值和分布情况来看,很明显的是大家都是经常被人白嫖的,这个结论似乎一点都不让人感到意外。

献给脱粉的朋友

谨以此图,献给脱粉的朋友,感谢曾经“相识”,我们有缘江湖再见。

在这里插入图片描述

以下是实现的Python源码。

# -*- coding: utf-8 -*-
import datetime

import pandas as pd
from wordcloud import WordCloud

today = datetime.datetime.today()

subscribe = pd.read_csv('./subscribe.csv',encoding='gb18030', header=0)
fans = list(pd.read_csv('./fansInfo.csv',encoding='gb18030', header=0)['ID'])

love_friend = []
# 距今超过300天的ID只添加一次,100-300的添加两次,其余添加3次。
for i in range(len(subscribe['ID'])):
    date = datetime.datetime.strptime(subscribe['关注日期'][i], "%Y/%m/%d")
    diff = (today - date).days
    if subscribe['ID'][i] not in fans:
        love_friend.append(subscribe['ID'][i])
        if diff < 300 and (today - date).days > 100:
            love_friend.append(subscribe['ID'][i])
        if diff <= 100:
            love_friend.append(subscribe['ID'][i])
            love_friend.append(subscribe['ID'][i])

res = ' '.join(love_friend)
# 生成词云
wc = WordCloud(
    font_path='simkai.ttf',
    background_color='white',
    width=600,
    height=600,
    max_font_size=50
)
wc.generate(res)
wc.to_file('res.png')  # 图片保存

我与粉丝的“合影”

在这里插入图片描述

哈哈哈,虽然想说越早关注的人字越大,但好像已经没有什么关系了,都看不到。

总结

  • 从粉丝们关注我的时间来看,确实我是在今年,尤其是今年暑期开始,迎来了粉丝迅速增长的时期,这里主要原因是因为我在暑假期间开始疯狂写作,目前我五十多篇博客中有大概三分之二的博客就是诞生于这个期间;而在这个期间前,大概是在去年11月份,主要是因为我写了有关智能优化算法的文章,才慢慢的有了最初的粉丝基础。
  • 从关注我的这1000个粉丝中不难看出,几乎80%的朋友是不发博客的,从点赞评论和收藏数量来看也有93%以上的人数据基本为0;而从码龄这个数据来看,关注我的群体主要集中在1-4年,从CSDN用户的角度(第一次使用CSDN的人多数是大一时期)可以大致推测,我的粉丝群体多数是在校的大学生,有少数工作多年的粉丝,但确实是少。

上述结果似乎带给我的信息不多,但好歹也算是我更进一步了解到了关注我的人大概是怎样的,这就已经很不错了!

从收集数据到进行数据分析,感受挺多的。虽然数据量少,分析方法简单,但终究分析还是有所收获。因为这次算是一次跟自己生活最贴近的数据分析了,以前分析的项目都是一些远在天边的东西,总和自己搭不了边。即使这次的结果不用去专门收集数据进行分析也能大致猜出来,但并不意味着我的分析就毫无意义。

无论结果,过程更有意义!


CSDN@报告,今天也有好好学习

评论 67
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

报告,今天也有好好学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值