流式计算
Baocai3000
技术源于需求又高于需求
展开
-
storm应用场景
Storm是Twitter开源的一个类似于Hadoop的实时数据处理框架(原来是由BackType开发,后BackType被Twitter收购,将Storm作为Twitter的实时数据分析)。实时数据处理的应用场景很广泛,如上篇文章介绍S4时所说的个性化搜索广告的会话特征分析。而Yahoo当初创建S4项目的直接业务需求就是为了在搜索引擎的‘cost-per-click’广告中,能根据当前情景上下文转载 2012-11-13 13:55:49 · 7187 阅读 · 1 评论 -
strom grouping
http://blog.sina.com.cn/s/blog_406d9bb00100ui5p.htmlstream grouping分类1. Shuffle Grouping: 随机分组, 随机派发stream里面的tuple, 保证每个bolt接收到的tuple数目相同.2. Fields Grouping:按字段分组, 比如按userid来分组, 具有转载 2012-11-13 13:53:27 · 1194 阅读 · 0 评论 -
Solutions to big data
转载 2013-05-28 19:04:49 · 907 阅读 · 0 评论 -
rabbitmq
1.download rabbit-mq server:wget http://www.rabbitmq.com/releases/rabbitmq-server/v3.1.3/rabbitmq-server-3.1.3-1.noarch.rpm download erlang:wget https://download3.vmware.com/software/vfabric/erlan原创 2013-07-24 20:50:29 · 919 阅读 · 0 评论 -
mysql远程
mysql> use mysql;Reading table information for completion of table and column namesYou can turn off this feature to get a quicker startup with -ADatabase changedmysql> SELECT User, Passwo原创 2013-08-08 14:24:26 · 728 阅读 · 0 评论 -
C45的.data和.names文件转化成Arff数据
package cn.ac.ict.ics.utils;import lombok.Cleanup;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.FileReader;import java.io.IOException;import java.nio.charset.Chars原创 2013-08-21 16:21:26 · 3610 阅读 · 0 评论