寻找afiee,为了一个提给我们对手的需求。
2009年8月,千鸟从西藏回来,团队启动小艾2.0的设计。
2009年9月,6个人收集了来自12家竞争对手的389条用户一手需求。
我们注意到有个叫afiee的用户,他在三个统计产品都发了同样的帖子。
“建议增加一个“零点击”统计功能有了这个功能,就可以知道一周内或者一个月内或者一年内,哪些商品是没人点击过的,把它们下架或删除了,就可以省下卖家许多时间。这些商品也不用跟热销的商品去挤队,淘宝的服务器也可少点负担”。
通过面向用户的功能论证,这是一个很有价值的需求点,纳入小艾团队的PRD文档中。
小艾团队很奇怪这样的一个优秀需求,为什么其他大统计团队没有做,甚至有的团队还要糊弄用户。
经过技术论证,答案找到了。
做零点击商品意味要满足两个条件:
1,必须通过淘宝或者阿里官方的api将用户所有的商品同步过来。
2,必须要将全部的商品进行分析,而不仅是分析抓取到的有流量数据的商品。
根据之前分析三千万条数据的经验,这意味商品数据库将增加一倍以上的存储数量。
之前有朋友说统计分析没有技术含量,其实这个是存在误区的。现在网上有些免费源代码,下载下来就能用,看起来简单无比。
其实大家算笔账,一台服务器上放5000个用户,每个用户平均每天300条pv,自有200个商品,每个商品存储24小时数据,分析的维度16个,如果采用一般数据库方案,很容易飞速膨胀,一开始感觉不到,数据上来以后整个系统立即奇慢无比。
这也就是很多做统计团队的壁垒。小艾团队在1.0的时候也遇到了瓶颈,每天单台数据分析量不到百万条就在也跑不动了。
2.0加上这个功能,意味着将承受极大考验。
最终,以用户为中心的思想统一了团队,我们加上了这个功能。
在经历了2个月的团队开发之后,2.0拿出来了。
Peter第一次跑生产数据的时候,我们都很不安,究竟能有多少提升,所有人都捏了把汗。
2500万条数据,5个小时分析完了。又跑了一遍,5个小时又跑完了……
这意味着小艾单台X86架构服务器,日分析量超越了1亿条。
我们开了一个内部的发布会,那天大家都很兴奋。
我们想起了那个叫“afiee”的用户,虽然你不是我们的用户,但是你却是我们最优秀的用户!
遗憾的是,原始链接已经找不到了。我们热烈期盼着afiee能看到这篇帖子。
寻找afiee,我们在这里等着你的出现,为了一个提给我们对手的需求。