- 博客(3)
- 收藏
- 关注
原创 用户留存的计算
用户留存的计算,基本是老生常谈了。可是这么多年下来,关于留存的计算,真的是差异太大了。最初版:将每个用户的所有交易月份用group_concat()函数进行连接,把对应的结果导出到excel中,然后再用countifs来进行计算……这个方法大概持续了半年左右,等到用户量大了之后,这个方法就不太好用了,特别是涉及到跨年的数据,好像也计算的不是特别准确。第二版:有天在对比这个月交易下个月流失的用户的时候,发现其实留存就是计算这批用户在后面月份中,有多少还有交易,所以出现了我这里也是巨复杂的第
2020-06-17 10:36:39
566
原创 随机抽样
近期因为要做一个流失回访的问题,涉及到随机抽样。说来惭愧,身为一个数据狗,居然之前没有接过这方面的需求,第一期抽样,我基本上按限定条件手工拉的,拉完的结果是:本来是我是抽流失的用户,结果7月回流的用户特别多后面想了下看来还是要用到随机函数进行处理。(这里插一个关于随机抽样的小插曲,今年公司的年会,用到的抽奖软件,中间各种bug,一度导致年会尬场,其实这个也是个随机抽样的问题。当时人力的小伙...
2018-07-18 14:57:35
1004
原创 用户画像
题记:从自己的印象笔记转过来的,搬到这里是想将自己的知识结构重新梳理。16年年底,开始转到产品部门负责数据仓库和用户画像的相关工作,之前一直是在各数据业务库里面摸爬滚打,提取各种数据,制作各种报表。不同阶段对同一个事情的认识会有不同的认识,记录一下这个阶段的我对用户画像的理解。***************************************************
2017-02-16 11:47:55
630
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人