百分点推荐引擎,实现了多种推荐算法,适应不同商务网站对不同推荐结果的要求。
为了设计大数据下、高可用高可靠、实时、可扩展、便于管理的推荐系统引擎。
百分点设计了如下推荐系统架构。
主要分4大部分:存储层、算法层、业务层、管理层。
存储层:存储用户原始浏览数据、用户数据、网站数据,作为算法层的基础数据。
算法层:核心关键部分,根据业务层不同需求,从存储层获取不同数据,调用不同算法,或者混合各种推荐算法,产生推荐结果。
业务层:与用户和网站进行交互,实时获得用户和网站的请求,将请求传递给算法层,将数据存储在存储层。
管理层:管理推荐引擎的配置、监控存储层、算法层、业务层的运行状态,对异常情况进行自动化处理或者给运维人员发送短信,通知其及时处理。
其中,算法层在线算法有:协同过滤算法;离线算法有:Kmeans聚类、FP-growth关联规则挖掘。