- 博客(2)
- 收藏
- 关注
原创 MR、Spark浅析
一、两者执行流程: 1.spark执行流程: 1.driver跟master建立连接并申请资源 2.Master进行资源调度 3.Master跟worker进行rpc通信,worker启动Executer 4.启动Executor 5.Executor跟driver进行通信 6.Rdd触发action后,根据rdd从后往前推断依赖关系,遇到shuffle递归切分stage,直到某个rdd没有父rd...
2018-12-02 18:05:10 1344
原创 用户画像浅谈
一、什么是用户画像 通过各个维度对用户或产品的特征属性的刻画,并对这些属性特征进行分析统计挖掘其潜在价值信息。完美的抽象出一个用户的信息全貌。简单来说就是将用户信息抽象出来的一个模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让人更容易理解用户,并且可以方便计算机理解处理。 用户画像是对现实世界中用户的...
2018-12-02 16:02:03 348
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人