数据仓库与数据挖掘-挖掘高价值B站up主案例

目录

一、实现目标

二、分析方法

IFL模型

三、数据预处理

 去重

缺失值分析与处理 

异常值分析与处理

​编辑 

可视化展示 

构建特征值 

构造F值

​编辑 

构造IFL分析数据集

​编辑 

构造L值 

数据标准化

​编辑 

 运用K-Means聚类方法

建立模型

 聚类结果特征分析

结论分析



一、实现目标

根据数据集中的up主视频播放信息,参考RFM模型,运用K-Means聚类方法对b站up主进行分群,比较不同up主的特征,挖掘出值得关注的up主、高价值的up主群体


二、分析方法

IFL模型

I(Interaction_rate): I值反映的是平均每个视频的互动率,互动率越高,表明其视频更能产生用户的共鸣,使其有话题感。 **I=(总弹幕数+总评论数)/总播放量/统计范围内视频数量

F(Frequence): F值表示的是每个视频的平均发布周期,每个视频之间的发布周期越短,说明内容生产者创作视频的时间也就越短,创作时间太长,不是忠实粉丝的用户可能将其遗忘。 **F=(统计范围内最晚发布视频时间-最早发布视频时间)/发布视频的数量

L(Like_rate): L值表示的是统计时间内发布视频的平均点赞率,越大表示视频质量越稳定,用户对up主的认可度也就越高。 **L=(点赞数X1+投币数X2+收藏数X3+分享数X4)/播放量X发布视频数


三、数据预处理

分析数据基于 bilibili 网站上的公开信息,主要采集了以下数据维度:

2019年1月~2020年3月,科技区播放量过5w视频的分区名称、作者名称、作者id、发布时间、播放数、硬币数、弹幕数、收藏数、点赞数、分享数、评论数,一共50130行。

数据来自 公众号 数据不吹牛

 

 去重

缺失值分析与处理 

 

异常值分析与处理

 

 

可视化展示 

 

 

 

构建特征值 

 

构造F值

 

 

构造IFL分析数据集

 

构造L值 

 

 

数据标准化

 


 运用K-Means聚类方法

建立模型

 聚类结果特征分析

 

 


 

结论分析

从案例结果来看,所有的渠道被分为3个类别,每个类别的样本量分别为:265、1082、204,对应占比分别为:17%、70%、13%。

类别1:索引为0的up主

该类别的I值略高于平均值,证明与观众的互动率较高,话题性也较高;但F值明显高于其他两类,创作周期较长; L值平均点赞率良好,仍有可提升空间;该类别大部分为业余up主,处于成长期。

类别2:索引为1的up主

该部分占了70%,是该分区的主要群体;该类别的I值稍低于平均值,与观众的互动良好;F值为三者中最低,更新频率高,活跃程度高; 但L值平均点赞率是短板,较低,暂未能获得大量观众的点赞、投币、收藏;需要提高视频稿件的质量,创作符合观众口味的视频,收获更多的三连

类别3:索引为2的up主

该部分up主群体I值远高于平均值,受到观众的喜爱,话题感十足;视频更新稳定,在保证不拖更的同时,收获到观众大量的三连(点赞、投币、收藏); 该类up主粉丝数目也大部分超过十万,能够提供高质量且稳定的视频稿件,为该分区的高价值up主群体。

投稿不易,感谢点赞!

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,关于数据仓库数据挖掘案例分析,我可以向您介绍以下两个案例: 1. Wal-Mart 数据仓库 Wal-Mart 是一家全球连锁零售巨头,拥有超过10,000个门店,在全球范围内雇佣了数以百万计的员工。为了在竞争激烈的市场中脱颖而出,Wal-Mart 在1990年代中期开始建立自己的数据仓库。 Wal-Mart 的数据仓库中包含了所有销售数据、库存数据、顾客数据等等,同时也包含了供应链、人力资源等多个方面的数据。Wal-Mart 通过数据仓库的分析,可以快速了解每个门店的销售情况,库存情况,以及顾客偏好等等,从而及时地做出相应的调整和决策。 通过数据仓库的分析,Wal-Mart 还能够发现一些有意思的规律。例如,他们发现周末顾客购买的啤酒和尿布的比例很,因此他们决定把这两种商品放在一起销售,从而提了销售额。 2. 零售公司的客户细分 另一个数据仓库数据挖掘案例是针对一家零售公司的客户细分。这个案例的目的是为了帮助这家零售公司更好地了解他们的客户,并且根据客户的特征和行为,将客户分成不同的类别,从而更好地进行营销和销售。 这个案例中,数据仓库中包含了大量的客户数据,包括购买记录、浏览记录、地理位置、性别、年龄等等。通过数据挖掘的分析,可以发现一些客户的特征和行为,例如购买频率、购买金额、购买种类等等。 最终,这家零售公司将所有客户分成了不同的类别,例如消费、低消费、潜在客户等等。然后,他们可以根据不同类别的客户,制定不同的营销策略和销售策略,从而提销售额和客户忠诚度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值