摘要:用数据分析解密咪蒙套路
关键词:标题 咪蒙 Python jieba
文末分享本文代码和数据,欢迎自取~
咪蒙时代已经伴随着压垮骆驼的最后一根稻草落下帷幕,我身为一个内容生产者,也曾经在朋友圈读过她的几篇文章。借着她的隐去,我随手百度到了她的一组文章数据,那么今天就用python和数据来一探咪蒙撰文必火的奥秘。
咪蒙的影响力
本来是想先用阅读量探究她的影响力究竟如何,然而清一色的10W+让我放弃了这个念头,我们还是从点赞情况开始。
首先,对数据做一下简单的清洗,使用pandas导入数据并去除空值:
data = pd.read_excel('咪蒙阅读数据.xlsx',sheet_name = 0)
data = data[data['赞赏']!=-2]
然后进行最大、最小、平均点赞数求取:
#计算平均点赞数
data1 = data.sort_values(by='点赞',ascending=False)
print('最大点赞数',round(data1['点赞'].max(),0))
print('最小点赞数',round(data1['点赞'].min(),0))
print('平均点赞数',round(data1['点赞'].mean(),0))
我们看到,**最大点赞数竟然也是10w+,最小的也有525,平均为1.2w。**有一个问题是,这份数据中,超过10w的点赞数只显示为100001,然而实际点赞数可能远超这个数,意味着平均赞数可能比1.2w还要高很多!
即使是阅读量超过1.2w都已经打败了90%的公众号,何况是点赞量。咪蒙老师在点赞量这一课上为我演示了什么叫“在座的都是渣渣”。
咪蒙是如何成长的
我们将点赞量放在时间的维度上进行观察,可以发现咪蒙的影响力是如何增长的。
#计算每年点赞量
data1['year'] = data1['发文时间'].dt.year
data_year =data1.groupby('year').sum()['点赞'].to_frame()
fig = plt.figure(figsize=(15,8))
x = data_year.index.tolist()
y = data_year['点赞&