- 博客(2)
- 收藏
- 关注
原创 基于用户行为的兴趣标签模型
随着网站规模的扩大,内容也相应的与日俱增,涵盖的频道也越来越繁杂,在如此海量的信息平台下,如何更好的服务用户成了各门户网站的首要任务。从用户需求的角度考虑,对内容的判断标准无疑是用户对此内容是否感兴趣。“千人千面”算法在互联网行业已经不是个新鲜的词汇,但如何做到对用户兴趣的精准匹配仍是难点,特别是对图片、视频等非文本内容来说,因为本身缺乏描述性文本,因此兴趣标签成为一种非常重要的语义素材。本文主要介
2015-10-29 11:07:29 26930 5
原创 Storm在推荐系统中的应用
Storm简介 apache开源社区项目Storm,是一款分布式实时计算系统。它之上的应用易于开发与部署。关于他们的介绍,请移步http://storm.apache.org/,那里有更官方且全面的介绍。 我们利用Storm擅长基于数据流并行计算的优势,弥补Hadoop在实时计算方面的缺憾。这些使用日志采集系统(比如基于Kafka或者Scribe)作为输入源计算出来的实时结果,将为
2015-10-12 15:49:25 5210 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人