《推荐系统实战》| 七. 推荐系统实例

        本章将首先介绍推荐系统的外围架构,然后介绍推荐系统的架构,并对架构中的每个模块的设计进行深入讨论。

7.1 外围架构

       推荐系统依赖的两个外围系统: UI系统(记录用户各种各样的行为) 和用户行为日志存储系统. 一般来说,需要实时存取的数据存储在数据库和缓存中,而大规模的非实时的数据存储在分布式文件系统(HDFS)上.

7.2 推荐系统架构

1. 推荐系统联系用户和物品的三种方式:

上面三种方式都可以抽象成一种基于特征的推荐系统架构, 也就是首先为用户生成特征,然后根据特征找到物品, 这样是推荐系统的两大核心任务.

2. 推荐系统需要由多个推荐引擎组成,每个推荐引擎负责一类特征和一种任务,而推荐系统将推荐引擎的结果按照一定权重或者优先级合并,排序然后返回.

7.3 推荐引擎的架构

1. A 生成用户特征向量: 

           用户特征包括两种:(1) 用户的注册信息 主要是用户的人口统计学特征

                                         (2) 由用户行为计算得到的特征: 这部分特征需要考虑用户行为的种类,产生时间, 次数, 物品的热门程度.

2. B 特征-物品相关推荐: 

           存储在Mysql中的物品相关性表: 存储了每个特征以及与之最相关的N个物品的id, 比如女性最喜欢看到前N个电影

3. C 排序模块

            (3.1) 过滤模块: 需要过滤掉: 用户已经产生行为的物品, 候选物品以外的物品, 某些质量很差的物品

            (3.2) 排名模块:

                    ①新颖性排名: 对热门物品进行降权

                    ②多样性, 提高多样性的方法: 1. 按照物品内容属性分成几类,分门别类选出排名最高的物品组合成推荐列表, 2.控制不同推荐理由出现的次数.

                    ③时间多样性: 提高时间多样性的两种方法.

                     ④ 用户反馈模块主要通过分析用户之前和推荐结果的交互日志,预测用户会对什么样的推荐结果比较感兴趣.

 

 

 

 

如今大数据已经成了各大互联网公司工作的重点方向,而推荐系统可以说就是大数据最好的落地应用之一,已经为企业带来了可观的用户流量和销售额。特别是对于电商,好的推荐系统可以大大提升电商企业的销售业绩。国内外的知名电商,如亚马逊、淘宝、京东等公司,都在推荐系统领域投入了大量研发力量,也在大量招收相关的专业人才。打造的电商推荐系统项目,就是以经过修改的中文亚马逊电商数据集作为依托,并以某电商网站真实的业务架构作为基础来实现的,其中包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。具体实现的模块主要有:基于统计的离线推荐、基于隐语义模型的离线推荐、基于自定义模型的实时推荐,以及基于内容的、和基于Item-CF的离线相似推荐。整个项目具有很强的实操性和综合性,对已有的大数据和机器学习相关知识是一个系统性的梳理和整合,通过学习,同学们可以深入了解推荐系统在电商企业中的实际应用,可以为有志于增加大数据项目经验的开发人员、特别是对电商业务领域感兴趣的求职人员,提供更好的学习平台。适合人群:1.有一定的 Java、Scala 基础,希望了解大数据应用方向的编程人员2.有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员3.有电商领域开发经验,希望拓展电商业务场景、丰富经验的开发人员4.有较好的数学基础,希望学br习机器学习和推荐系统相关算法的求职人员
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值