这里考虑Bilibili、Niconico两个有排行系统且有公开规则的相关数据。
A.周刊哔哩哔哩排行榜 (#416)
考虑#416期视频结果,前5名分数情况如下
Rank 5 Total 1252578
Play 666366×0.650 Comment 2103×36.0
Fav 21371×20 Coin 43926×7.2
Rank 4 Total 1347337
Play 439715×0.727 Comment 2858×40.0
Fav 15434×20 Coin 75560×8.0
Rank 3 Total 1475896
Play 2319208×0.011 Comment 19871×17.0
Fav 38600×20 Coin 54696×3.4
Rank 2 Total 2001856
Play 509712×0.696 Comment 4699×50.0
Fav 52722×20 Coin 35761×10.0
Rank 1 Total 2017074
Play 585100×0.671 Comment 5629×40.0
Fav 22513×20 Coin 118638×8.0
考虑修正A与修正B的作用。修正A主要用于限制播放数过高的视频。当视频点击大于20w后通过加权形式使点击量收益减小。
修正B则为限制评论、播放过高的视频。榜单默认认为评论、播放是容易受到用户操纵影响的因素,而硬币、收藏则不易被操纵。因此在提供的修正2的公式中将硬币、收藏置于分子部分,其余置于分子部分。若视频播放、评论数量异常升高,且达到了另外两项因素未跟上的程度时,则会对其增长收益进行限制。可以用Rank2到Rank1的播放、评论数据比进行功能检查。
由于分P为B站特有功能所以不考虑分P修正的作用。
B.Niconico 週刊VOCALOID·UTAU Ranking #557・499
Rank 5 Total 82310
Play 39236×1.35 Comment 909×0.81
Fav 2368×12.08
Rank 4 Total 92482
Play 60302×1.25 Comment 384×0.95
Fav 2244×7.46
Rank 3 Total 94531
Play 48017×1.28 Comment 1518×0.75
Fav 2767×11.54
Rank 2 Total 122312
Play 122068×1.00 Comment 199×0.99
Fav 169×0.28
Rank 1 Total 177493
Play 144910×1.15 Comment 2798×0.83
Fav 2478×3.44
N站没有硬币系统,因此榜单只提供3个数据。规则中的Mylist等同于Fav(收藏)
存在补正A、B、C三个补正值系统。依次分析。
补正A:将其他数值放到分母分子,将评论只置于分母,且给予其10次方加成。作用等同于B站的修正B,但修正程度更为严格(这个榜单可以作为这个音乐圈的风向标,所以经常被恶意刷分。)
补正B:收藏比×200,收藏总分最大值限定为播放数的5倍。前一个规则是让同等收藏量,拥有更高收藏比的作品获得更高的收益;后者为防止恶意刷分所设置的分数上限。
补正C:从投稿时间开始的14天内获得播放部分的分数加成,时间越短补正越高。这是鼓励新作品的举措。
由于这个榜单经常被恶意操纵数据,所以算法方面并不会让其中任何一个项目过高时让收益过分提高。
综上可以看出,一般情况下可以将网站的用户数据分为以下几种类别:
1. 播放/浏览等必定执行的操作
2. 评论等互动操作
3. 硬币/收藏等高价值操作
对这三类情况分别讨论:1操作为基础操作,操作最频繁且数值相对这三种而言最高,一般考虑给予较低的加权。当有意图加入新的数值指标时可以考虑对其进行变动不大的加权操作;2操作为用户互动操作,其特点是可以体现内容的用户活跃情况。但因为这一项容易被用户控制,所以一般考虑对其进行负加权;3操作用户不易操作、数值相比较小且能体现内容的价值性,通常给予其较高的加权。