用户画像
改进的拜耳法—木研
这个作者很懒,什么都没留下…
展开
-
用户标签(四):MD5代替Hashcode生成唯一数字编码
MD5代替Hashcode生成唯一数字编码附录说明:MD5生成数字代码实现辛苦码字如有转载请标明出处谢谢!——拜耳法附录说明:本文主要涉及的是在图计算过程中,需要数字类型值做每个图点的id,在大量数据下生成hashcode作为id会有重复的风险,因此需要使用一个固定不重复算法作为我们的id生成规则!MD5生成数字代码实现import java.math.BigIntegerimport java.security.MessageDigest/** * @Author: baierfa原创 2020-12-25 12:01:21 · 2580 阅读 · 1 评论 -
用户标签(二):增量版ID_Mapping、Oneid图计算打通数据孤岛实现
增量版ID_Mapping、Oneid图计算打通数据孤岛实现1与上篇文章的区别2、数据样例3、实现代码启动命令辛苦码字如有转载请标明出处谢谢!——拜耳法PS:我要在下一章在我心中不完美的你打一个淋漓尽致的标签1与上篇文章的区别单就实现上其实与上篇文章差距不大,主要在业务上本文解决了上篇文章每次运行都会生成新的oneid的问题,如果每次运行都生成新的oneid那我们给标签做整理标记的时候会找不到人的!例如:在上篇文中1月1日 姓名:小白 手机号:9527 生成onid 11111月2日原创 2020-08-11 23:28:37 · 4739 阅读 · 3 评论 -
用户标签(三):oneid与用户标签之间的相互打通 实现用户标签
oneid与用户标签之间的相互打通 实现用户标签附录说明:整个流程:1、使用数据源数据进行数据清理(整理出关联数据与将要打标的数据值)2、将关联键值与oneid对应关联起来 并整理好将要打标值的外部关联格式化3、数据打标形成格式4、数据输入中间表 目的是汇总多个源产生的数据标签方便下一步汇总使用5、创建hive最终结果表6、对应创建es表建立映射关系7、从中间表读取数据进行汇总8、数据结果输入到建立映射的hive表中在es中查询辛苦码字如有转载请标明出处谢谢!——拜耳法附录说明:实现完整的用户标签需要以原创 2020-08-06 10:57:15 · 9925 阅读 · 2 评论 -
用户标签(一):图计算实现ID_Mapping、Oneid打通数据孤岛
图计算实现ID_Mapping、Oneid打通数据孤岛ID_Mapping与Oneid的作用我们能用来做什么实现原理输入数据源格式样例当日代码生成引用jar包启动命令辛苦码字如有转载请标明出处谢谢!——拜耳法ID_Mapping与Oneid的作用我们能用来做什么实现原理输入数据源格式样例当日代码生成import java.util.UUIDimport cn.scfl.ebt.util.UtilToolimport org.apache.spark.SparkContextimport原创 2020-08-05 23:31:43 · 11687 阅读 · 5 评论