链接
本文基于上篇文章提过的Niconico视频网站的成绩评定系统进行讨论。
上链接为基于机器学习算法演算的结果进行作品质量比较。
首先算法对每个浏览操作进行伯努利实验:将“观看后收藏”视为权重1,将“观看后不收藏”视为权重0。
然后,计算收藏率期望值μ与均方误差MSE(详细步骤省略,可见文首链接。)
最后据此获得最终的内容得分。
算法最终呈现的数据情况如图。颜色代表收藏率,纵轴代表播放量,横轴代表En值,也就是算法所给出的评定分数。
可以看出,该算法可以在一定的浏览数量限制内(用法中说明为在10万以内)可以对于浏览量与收藏比相对而言给出较为公正的评价。
综上所述,基于机器学习算法来进行内容质量的筛选是可行的,但需要有足够大量的数据支持以作为学习数据。