- 博客(1)
- 资源 (3)
- 收藏
- 关注
原创 流数据挖掘
流数据处理的限制: 1)分发速度非常快,必须及时处理,否则将永远丢失。2)即使分发速度较慢,同时多个数据流一起则超过了内存最大容量。 1.流数据抽样 问题描述:过去的一个月中典型用户提交的重复查询比率是多少。假设我们只存储其中十分之一的流元素 典型做法:对每个搜索查询产生一个随机数(比如0-9中间的一个随机数),并当且仅当为0时才存储。如果用户提交的查询足够多,
2013-10-14 23:00:41 1945
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人