Big Data
文章平均质量分 82
linhx
APACHE Flume Hive等开源贡献者
大数据专家、IBM BI 认证专家
目前专注数据挖掘机器学习等领域
展开
-
Flume 学习笔记 一 : Flume User Guide
<br />1. Architecture 总体概述<br /><br />Flume’s architecture is simple, robust, and flexible. Themain abstraction in Flume is a stream-oriented data flow. A data flow describes the way a singlestream of data is transferred and processed from its point原创 2011-05-12 15:07:00 · 1232 阅读 · 0 评论 -
Hadoop Job Scheduler作业调度器(转载)
Hadoop Job Scheduler作业调度器2010-08-16 14:59作者:hovlj_1130 | 可以任意转载, 但转载时务必以超链接形式标明文章原始出处 和 作者信息 及 版权声明http://hi.baidu.com/hovlj_1130/blog/item/fb84dd1e3558d8f8e0fe0b8e.htmlHadoop Jo转载 2012-08-08 16:57:57 · 743 阅读 · 0 评论 -
Flume NG flume-hdfs-sink 源代码分析
C1: HDFSEventSink0. HDFSEventSink.configure() also needs to implement a Configurable interface for processing its own configuration settings.0.1 从context中读取配置参数configure;0.2 设置编码, cod原创 2012-08-30 21:19:00 · 2298 阅读 · 2 评论 -
Flume NG configuration sample
1. 配置source 为 execagent1.sources = tailagent1.channels = MemoryChannel-2agent1.sinks = HDFSagent1.sources.tail.type = execagent1.sources.tail.command = tail -f /var/log/apache2/acce原创 2012-08-30 21:18:38 · 1518 阅读 · 0 评论 -
Hadoop10大应用案例 & 多个行业(转载)
生命力旺盛!Hadoop10大应用(含8家潜力企业)发表于23小时前| 1070次阅读| 来源gigaom| 2 条评论| 作者Derrick HarrisHadoop大数据行业应用安全摘要:谈到Hadoop应用,为搜索引擎提供动力或者为广告商提供用户行为分析的平台方面显然最为知名。但在此以外,还有在线旅游、移动数据、电子商务、能源发现、能源节省、基础设施管理、转载 2012-09-04 10:57:02 · 13893 阅读 · 0 评论 -
pig tutorial编译问题
对pig tutorial进行ant build,出错了,错误类似, [javac] /opt/ibm/biginsights/pig/tutorial/src/org/apache/pig/tutorial/NGramGenerator.java:75: cannot find symbol [javac] symbol : class Schema [javac] l原创 2012-09-11 16:02:48 · 1080 阅读 · 0 评论 -
Intelligent Applications: The Big Data Theme for 2013 - See more at: http://blog.infochimps.com/2013
图挺好, 简单明了! 学习!My prediction for 2013 is that competitive advantage will translate into enterprises using sophisticated Big Data analytics to create a new breed of applications - Intelligent Appl转载 2013-02-28 10:35:42 · 731 阅读 · 0 评论 -
FLume NG 开发环境
主要过程及问题1. 下载Flume NG的source code2. 安装Maven 3.*3. 下载Eclipse 4. 安装m2eclipse3和4步遇到的问题:问题一: Eclipse Indigo 版本, 对应的m2eclipse版本比较高,在1.**左右。 m2eclipse对Indigo里Maven的pom.xml做了改变,, 特别是原创 2012-07-17 11:07:14 · 3198 阅读 · 2 评论 -
Flume 的使用案例
Part I. 单节点上设置,1. dump commandThe command’s syntax is flume dump []. It prints data from to the console. Optionally, an output format can be specified, otherwise the default text format is used.原创 2012-07-17 11:06:25 · 1814 阅读 · 0 评论 -
Big Data 暨IBM BigInsight 应用行业总结分析
Normal 0 7.8 pt 0 2 false false false MicrosoftInternetExplorer4 /* Style De原创 2011-06-20 16:35:00 · 1869 阅读 · 0 评论 -
使用HBase Shell 接口的注意事项
HBase Shell 接口本身没有什么可谈的,网上许多内容都有介绍, 半个小时就可以入门。同事们要我推荐一下,那就推荐三个如下:(1) http://wiki.apache.org/hadoop/Hbase/Shell(2) ./hbase shell 打开shell, ru原创 2011-07-26 16:34:35 · 2980 阅读 · 0 评论 -
了解NoSQL的必读资料
NoSQL 是非关系型数据存储的广义定义。它打破了长久以来关系型数据库与ACID 理论大一统的局面。NoSQL 数据存储不需要固定的表结构,通常也不存在连接操作。在大数据存取上具备关系型数据库无法比拟的性能优势。该术语在 2009 年初得到了广泛认同。当今的应用体系结构需要数据存储在横向伸缩性上能够满足需求。而NoSQL 存储就是为了实现这个需求。Google 的BigTabl转载 2010-12-06 11:47:00 · 469 阅读 · 0 评论 -
虚拟机里在ubuntu linux上搭建Eclipse的HBase 开发环境
要求: Hadoop/HBase集群运行在远程的数据中心; 开发环境搭建在本地的虚机的ubuntu 系统里1. 虚拟机,比如VMware,virtual PC or ...., 里建立ubuntu linux2. 下载Eclipse JEE Version, Helios是个不错的考虑, 这里强烈建议用JEE version,实际开发后你就会发现省事不少;3. Had原创 2011-11-14 15:41:14 · 3238 阅读 · 2 评论 -
MapReduce 运行过程源代码分析
1. Map类及流程分析(1) InputFormat generates InputSplit and produces RecordReader; An InputSplit is a logical representation of a unit of input work for a map task; RecordReader will turn those logical w原创 2012-03-09 22:28:33 · 566 阅读 · 0 评论 -
Install Cloudera CDH3 on Ubuntu 11.04 单机
Part I Hadoop Click one of the following:this link for a Maverick system. 安装一个最近的吧Install the package. Do one of the following:Choose Open with in the download window to use the p原创 2012-06-06 16:01:13 · 1695 阅读 · 0 评论 -
Hadoop distcp command error
distcp 一直出错, 问题如下: [biadmin@shihc063 ~]$ hadoop distcp file:///local/hadoop/data/bulkload/smallset/smallest/ hdfs://180.191.56.34:9000/data/hbase/input/copy1/11/12/19 07:10:09 INFO tools.DistCp:原创 2012-06-11 07:36:46 · 1718 阅读 · 1 评论 -
How to setup FlumeNG with example configuration
1. Check out the sourceFor those that prefer subversion:$ svn checkout https://svn.apache.org/repos/asf/incubator/flume/trunk/If you're more of a git person:$ git clone git://原创 2012-06-16 19:46:23 · 1775 阅读 · 0 评论 -
大数据领域的顶级开源工具大集合(转载)
大数据领域的顶级开源工具大集合2014-04-15 14:50CSDN作者 CSDN CODE 0 420大数据 开源工具 hadoop cloud foundry openstack如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。本文介绍了一些大数据方面的顶级开源工具,分为四个领域:数据存储,开发平台,开转载 2014-04-15 18:39:34 · 749 阅读 · 0 评论