产品健康度模型之指标结构管理
因为指标数据的量是超大的,所以指标并不是放在数据库中,而是集群之上,指标一期一期的归库,除了文件名,文件的入库时间,其他没有任何信息。所以目前有哪些产品,这些产品有多少期指标,每一期都有哪些对应指标,指标的相关信息,每个指标的模型参数,都需要我们自己写程序来维护。
我们做的产品指标管理模块是基于文件的,其实要转成基于数据库的很容易。下面就来介绍一下指标管理模块的功能。
“产品”和“粒度”
前面我们是这样推出产品的概念的——有一个产品,他有很多运营和运维指标。
实际中,这个过程可能是逆过来的——有很多很多指标,这部分隶属于这个产品,而那一部分隶属于另一个产品,并且产品指标可能有重叠,因为不同的产品可能共用一些硬件,所以共享这些硬件指标。
不仅如此,对于同一个所谓产品,可能又有不同粒度的子产品,这个粒度包括“个体粒度”和“时间粒度”。
对于不同“粒度”的问题,我们来举一个具体的例子,比如对于”手机对讲机”这个产品,从时间粒度上,我们可以将产品性能指标的提取粒度控制在小时、天或者星期,那么这三种不同的时间粒度,可以理解为三种不同的产品,并且,我们对实时产生的指标也就不同——比如对于“天”这个粒度,一个实时产生的指标值最起码也是一天的统计结果值,而对于“星期”或者“月”又是另一种统计方法。
在个体粒度上,对于所有的指标记录,我们可以拿某个用户的所有指标作为一个产品,也可以拿某个集团用户的指标作为产品。
这里我们先不对粒度做探讨&