项目背景:CSR订单系统,已经上线1年半,现在迭代需求,涉及到不同的统计口径和算法 ,需要梳理全部的已记录次数的数据节点以及需要增加埋点的button列表
流程梳理:
1、埋点 | 就是在正常的功能逻辑中添加统计逻辑,例如:某些个button的点击次数统计,某个页面的停留时长的统计等: 举例CSR: 1.csr从Item page和Edit View页面的ChangeItem Info.按钮进入到菜单页面点击save按钮后,作为一次自动反馈。 2.Sold Out、SoldOut恢复成Normal、New Item操作成功后,各作为一次自动反馈。 3.餐厅关门、餐厅back to normal的操作,各作为一次自动反馈。 4.增加White Board时作为一次自动反馈 以上为运营一年之后大家对客服绩效的再次改动,所以新增了n多埋点的需求,之前都没有这个统计 |
2、上报 | 并不是每统计到一次事件或者状态就会发起数据上报,客户端统计到的数据会先暂时存储在内存或者磁盘上,当用户启动、退出应用程序的时候,或者在其他更合适的时机,将当前周期统计到的事件批量上报到服务器 |
3、后台记录日志 | 数据上报到服务器后,服务器会将客户端上报的原始数据存储到服务器的磁盘中。一般来说,非强实时性的数据上报到服务器后,并不会立即参与计算,获得最终的统计结果,比如某个button的日点击次数,日访问的user id数,日留存等数据,而是等到服务器负载较低的时间段利用预先配置的计划任务进行离线处理 |
4、计算&入库 | 使用用户数等信息,就需要用到「数据仓库工具」,比如当下流行的Hive处理工具,它基于Hadoop分布式系统基础框架,利用计算机集群的能力进行分布式计算。当「数据仓库工具」计算出最终的结果后, CSR举例:内部管理系统,没有那么大的访问量,所以可以直接在程序里计算 |
5、展示 | 展示方式随机多样,数据挖掘平台或者应用系统本身所包含的数据统计报表都可以成为展现的媒介 |
接下来确认算法咯!