项目安排:
企业级360°全方位用户画像
一、用户画像概念、设计构建用户画像及项目演示说明 -2天
用户画像概念发展
如何构建用户画像
标签Tag
项目核心功能:
深入剖析(最关键)
项目工程初步搭建
二、基础知识:数据导入ETL和应用调度 -2天
a)、数据采集与ETL
如何将业务数据采集导入到大数据平台上(HDFS、Hive、HBase)
b)、标签 -> 模型 -> SparkApplication
Oozie
===============================================================================
三、标签开发(基础标签) - 12天
a)、规则匹配标签 + GitHup 5天
b)、统计标签 2天
---------------------------------------------------------------------------
c)、挖掘标签 5天
涉及机器学习算法:聚类KMeans、决策树DecisionTree
===============================================================================
四、商品推荐体验及多数据源 - 3天
a)、当用户点击浏览商品时,给用户推荐商品(Top10)
涉及机器学习算法:ALS(交替最小二乘法)
b)、标签系统支持多种数据源
可以从任意数据源加载业务数据,构建标签,比如从HBase、Hive、MySQL和HDFS等等
第一部分
什么是用户画像???
对用户的描述 使用标签来进行标注(标识注明)!
学生的属性:
学生,帅,漂亮,性别,年龄,身高,成绩,体重,婚姻状况,月收入,兴趣爱好,籍贯,学号,政治面貌,发型,国籍。
学生的标签:
标签=> 标签值【特征=>特征值】
学校角色=>学生,
外貌=>帅/漂亮
性别=>男/女,
年龄=>20/21,
身高=>176/180,