程序猿酋长进阶之路

推荐:

电影推荐系统

使用git进行代码版本管理,使用markdown编写文档,

技术站

前端:angular
后端:Spring,ES,MongoDB,Redis,
数据端:Flume -> Kafka -> Spark Streaming -> MongoDB

1、使用Flume收集用户日志,例如评分行为、点击行为、浏览行为。
2、Kafka实时读取Flume收集的日志信息。
3、Spark Streaming消费kafka队列的数据。
4、使用ALS算法对评分矩阵做矩阵分解,根据电影的隐语义特征计算电影之间的相似度,并将相似度做倒排索引,例如{‘movieid1’:[(‘movieid2’,‘0.99’), …]},并将倒排数据持久化到MongoDB。
5、利用电影的标签数据,使用TF/IDF来计算电影之间的相似度,同样使用倒排的思路持久化道MongoDB。
6、实时推荐:利用电影的相似度倒排,根据用户最新的电影评分或者点击行为来做推荐,使用Spark Streaming来实时计算推荐优先级,然后存储到Redis中,提高用户的访问体验。
7、使用spark计算每个门类的平均评分最高的电影来解决冷启动问题。
8、使用spark将日志数据做分析和处理,然后持久化道MongoDB、ES等数据库中,实现data loader功能。
9、使用了业界广泛使用的movielens数据集,并了解过lastfm、netflix等著名的数据集。
10、将推荐系统引擎模块化:als矩阵分解的相似度计算、基于tfidf的相似度计算、实时推荐模块,每一个引擎都会产生一个推荐列表,对不同的引擎赋予不同的权重,然后合并列表,产生推荐数据。
11、通过A/B测试来评估推荐结果
12、优化spark的计算效率,比如将一些数据进行.cache()操作缓存,对某些数据做broadcast广播到其他节点,加快运算。
13、使用git进行版本管理,远程代码仓库使用自己搭建的gitlab

前端埋点 -> 阿里云oss -> shell/python脚本下载日志数据 -> 转换成hdfs -> spark离线计算

logging.info()

解决业务场景中出现的数据倾斜问题

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
VR(Virtual Reality)即虚拟现实,是一种可以创建和体验虚拟世界的计算机技术。它利用计算机生成一种模拟环境,是一种多源信息融合的、交互式的三维动态视景和实体行为的系统仿真,使用户沉浸到该环境中。VR技术通过模拟人的视觉、听觉、触觉等感觉器官功能,使人能够沉浸在计算机生成的虚拟境界中,并能够通过语言、手势等自然的方式与之进行实时交互,创建了一种适人化的多维信息空间。 VR技术具有以下主要特点: 沉浸感:用户感到作为主角存在于模拟环境中的真实程度。理想的模拟环境应该使用户难以分辨真假,使用户全身心地投入到计算机创建的三维虚拟环境中,该环境中的一切看上去是真的,听上去是真的,动起来是真的,甚至闻起来、尝起来等一切感觉都是真的,如同在现实世界中的感觉一样。 交互性:用户对模拟环境内物体的可操作程度和从环境得到反馈的自然程度(包括实时性)。例如,用户可以用手去直接抓取模拟环境中虚拟的物体,这时手有握着东西的感觉,并可以感觉物体的重量,视野中被抓的物体也能立刻随着手的移动而移动。 构想性:也称想象性,指用户沉浸在多维信息空间中,依靠自己的感知和认知能力获取知识,发挥主观能动性,寻求解答,形成新的概念。此概念不仅是指观念上或语言上的创意,而且可以是指对某些客观存在事物的创造性设想和安排。 VR技术可以应用于各个领域,如游戏、娱乐、教育、医疗、军事、房地产、工业仿真等。随着VR技术的不断发展,它正在改变人们的生活和工作方式,为人们带来全新的体验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值