以下是csdn论坛上的一个帖子:
很长的log file记录了用户访问amazon.com的过程,两列分别为 userID 和
pageName.
log从上倒下按照点击发生的时间顺序。找出最popular的3连击。
eg:
zhang welcome
Li Hello
Wang welcome
Li books
Wang Hello
zhang books
Li shopping cart
Li checkout
zhang shopping cart
Wang camera
zhang checkout
最popular的3 combo是books -> shopping cart -> checkout
我一时找不出什么办法,只有一个最笨的办法就是把所有的3连击都找出来。