Figueiredo F . On the prediction of popularity of trends and hits for user generated videos
会议论文:Proceedings of the sixth ACM international conference on Web search and data mining. ACM, 2013.
关键字: popularity; user-gernerated; video; trends
摘要:
UGC的出现作为Web 2.0时代主流的媒体形式,我们的研究目的是理解并预测流行趋势(例如,是否一个视频会是病毒式传播的?)并且它的热度(可达到的最大传播峰值)。这些只是对于各式各样的服务,包括内容分发和广告投放都至关重要。因此,我们在论文中形式化了预测UGC流行度的模型。此外,我们描述了针对这一问题的解决方法。我们工作的新颖之处在于同时预测了流行趋势和流行峰值。更进一步,我们希望不仅是通过寻常的误判率,同时通过我们预测可能产生的在线广告收益对结果评估。在描述了我们的研究目的后,研究发现可以总结为:(1)揭示了通常情况下的流行度趋势;(2)衡量了UGC特征和流行度趋势之间的关系;(3)评估了模型对预测流行度趋势的效率。
方法:
第一步,数据获取。
为例理解视频流行度的增长态势,我们可以从 YouTube 或者 Vimeo中收集数据。同时提供不同视频在网站上流行度的时间序列数据。视频平台也提供了关于前十位引流用户的导流者。此外,一些流行度的迹象可以从用户评论的时间戳中推知。一些即时信息在许多web2.0网站中可得,虽然每个视频只呈现了前十位的导流者,我们指出,这些导流账户对观看量的影响不可忽略,即使是在成百万的观看者中也是如此,这对我们构建时间序列的预测模型很有帮助。我们的数据是基于已有的数据研究的,未来有机会,我们也考虑使用仿真数据或者大型本地网络数据。
第二步,特征选取。
着重考虑了导流者特征(link)。
发现:
使用KSC算法( K-Spectral clustering),发现了四类视频流行形态: