自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (25)
  • 收藏
  • 关注

转载 Flume详解

一、Flume介绍Flume是一个分布式、可靠、和高可用的海量日志聚合的系统,支持在系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。设计目标:(1) 可靠性当节点出现故障时,日志能够被传送到其他节点上而不会丢失。Flume提供了三种级别的可靠性保障,从强到弱依次分别为:end-to-end(收到数

2016-02-15 16:12:50 566

原创 Flume原理

Flume介绍Flume是一个分布式、可靠、和高可用的海量日志聚合的系统,支持在系统中定制各类数据发方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能。Flume采用了分层架构:分别为agent,collector和storage。其中,agent和collector均由两部分组成:source和sink,sou

2016-02-15 16:06:23 911

转载 HIVE和HBASE区别

HIVE和HBASE区别1. 两者分别是什么?   Apache Hive是一个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce. 虽然Hive提供了SQL查询功能,但是Hive不能够进行交互查询--因为它只能够在Haoop上批量的执行Hadoop。

2016-02-15 15:01:49 438

转载 zookeeper基本原理及适用场景

1.1 zookeeper简介       Zookeeper 是 Hadoop 生态系统中的协同实现,是Hadoop集群管理的一个必不可少的模块,它主要来控制集群中的数据,如它管理Hadoop集群中的NameNode,还有Hbase中Master Election、Server之间状态同步等。Zookeeper 实际上是 Google 的 Chubby 一个开源的实现。Zookeep

2016-02-15 11:27:18 544

转载 pig hive hbase之间的关系和差异

Pig一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了。当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护。)Pig是一种数据流语言,用来快速轻松的处理巨大的数据。Pig包含两个部分:Pig Interface,Pig Latin。Pig可以非常方便的处理HDFS和HBase的数据,和Hive一样,Pig可以

2016-02-13 16:09:56 666

转载 对于hadoop生态圈的理解

大数据,首先你要能存的下大数据。传统的文件系统是单机的,不能横跨不同的机器。HDFS(Hadoop Distributed FileSystem)的设计本质上是为了大量的数据能横跨成百上千台机器,但是你看到的是一个文件系统而不是很多文件系统。比如你说我要获取/hdfs/tmp/file1的数据,你引用的是一个文件路径,但是实际的数据存放在很多不同的机器上。你作为用户,不需要知道这些,就好比

2016-02-13 16:08:42 3101

原创 pig: ERROR 1070

如图 ,对 上方 形如  ( 139250057413,{(139250057413,69,63,11058,48243)}) 的分过组的数据进行 统计, 使用命令 D = FOREACH C GENERATE group,sum(B.t6).......出现错误   : ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1070: Could

2016-02-13 10:56:47 600

原创 pig实战演练:手机流量统计

•pig是一种操作hadoop的轻量级脚本语言,是基于hadoop的数据处理框架•Pig包括两部分:  用于描述数据流的语言,称为PigLatin。  用于执行PigLatin程序的执行环境,当前有两个环境:单JVM中的本地执行环境和 Hadoop集群上  的分布式执行环境。• Pig和mapReduce的区别:  mr是基于java的,代码冗长复杂       P

2016-02-13 10:47:05 572

原创 hive实战演练:手机流量统计

hive 本质上是一个 sql 解析引擎 ,提供了一种类sql语言 hql 以便于使用,将我们熟悉的sql语言 转换成了 一个个map-reduce进程需求 : 统计如下文件中 每个手机号使用流量的情况 待处理文件:http.dat1363157985066 1372623050300-FD-07-A4-72-B8:CMCC 120.196.100.82i02.c.al

2016-02-05 11:34:57 945

原创 linux下启动、登陆 mysql 出现ERROR 2002(HY000):can't connect to local mysql server

linux下启动、登陆 mysql 时 出现ERROR 2002(HY000):can't connect to local mysql server through socket ‘/var/lib/mysql/mysql.sock'今天登陆mysql -u -p 时 ,突然出现了如上错误 , 原因 应该是因为有多个mysql进程在运行 发生了冲突 解决方法:  首先命令 /

2016-02-05 10:09:29 6609 2

转载 rpm安装的mysql 如何卸载干净

rpm方式安装的mysql首次 查看系统中是否以rpm包安装的mysql:[root@localhost opt]# rpm -qa | grep -i mysqlMySQL-server-5.6.17-1.el6.i686MySQL-client-5.6.17-1.el6.i686然后卸载mysql[root@localhost l

2016-02-04 16:02:05 496

原创 hive show databases 报错 ERROR in metadata : metadata Exception

使用hive时出现如上错误FAILED : Error in metadata : MetaException(message :Got exception : java.net.Connect Exception Call to hadoop/192.168.56.100:9000 failed on connection exception: java.net.ConnectExcepti

2016-02-04 15:09:57 1376

原创 sqoop import ERROR sqoop.Sqoop: Got exception running Sqoop: java.lang.RuntimeExceptrion

使用sqoop 将mysql中的表上传到hdfs中时 出现error sqoop.Sqoop: Got exception running Sqoop: java.lang.RuntimeExceptrion解决方法: 把mysql-connector-java  的jar包 复制到 /sqoop/lib 的目录下jar包下载地址: http://download.csdn.net/d

2016-02-04 11:42:00 13555 4

转载 HIVE与mysql

hive是一个基于Hadoop的数据仓库平台

2016-02-03 16:54:06 1024

原创 linux下安装mysql的详细教程

首先将mysql-client   mysql-server   mysql-connector 复制到linux 的/usr/local 目录下mysql下载地址:mysql-clientmysql-server     mysql-connector然后

2016-02-03 10:50:59 402

原创 hive 安装和配置 详细教程

首先使用工具winscp 或 共享文件夹 将hive-0.9.0.tar.gz 复制到/usr/local 路径下(winscp 下载路径:http://download.csdn.net/detail/xq_iris/9413944    hive下载路径:http://download.csdn.net/detail/xq_iris/9425489  )然后输入命令 tar -

2016-02-02 16:34:36 1157

原创 pig安装和配置 详细教程

首先,通过winscp工具或者共享文件夹 把pig-0.11.1.tar.gz 复制到 /usr/local目录下(winscp下载地址 :  http://download.csdn.net/detail/xq_iris/9413944  ) ( pig 下载地址:     http://download.csdn.net/detail/xq_iris/9425711)

2016-02-02 15:44:23 2075

tableau_desktop9.0中文文档

tableau_desktop9.0中文文档免费下载

2016-07-18

HBase基本操作 Java代码

HBase基本操作 增删改查 java代码 要使用须导入对应的jar包

2016-02-15

Shell脚本学习指南.pdf高清带书签中文版 免费下载

Shell脚本学习指南.pdf 高清 带书签 中文版 免费下载

2016-02-06

hadoop学习 测试数据:手机上网日志

hadoop学习时用到的 测试数据:手机上网日志

2016-02-05

sqoop-1.4.3.bin__hadoop-1.0.0 for linux免费下载

sqoop-1.4.3.bin__hadoop-1.0.0 for linux免费下载 sqoop用于对数据进行导入导出 (1)把MySQL、Oracle等数据库中的数据导入到HDFS、Hive、HBase中 (2)把HDFS、Hive、HBase中的数据导出到MySQL、Oracle等数据库中

2016-02-04

MySQL-server-5.5.31 for linux 免费下载

MySQL-server-5.5.31 for linux 免费下载

2016-02-02

MySQL-client-5.5.31 for linux 免费下载

MySQL-client-5.5.31 for linux 免费下载

2016-02-02

pig-0.11.1 linux 免费下载

pig-0.11.1 linux 免费下载 pig 是hadoop上 基于mapReduce 的 语言 为不会java编程的人使用map reduce 提供了极大的方便

2016-02-02

hive-0.9.0 linux免费下载

hadoop中的数据仓库 提供管理和查询数据的功能

2016-02-02

hadoop-1.1.2 linux 免费下载

hadoop-1.1.2.tar.gz linux下的hadoop 在命令行中解压 修改配置文件 即可使用 安装方法参考 http://blog.csdn.net/xq_iris/article/details/50560360

2016-01-28

hadoop入门java代码hdfs文件操作 wordCount源码

hadoop入门级的代码 Java编写 eclipse可运行 包含 hdfs的文件操作 rpc远程调用的简单示例 map-reduce的几个例子:wordcount 学生平均成绩 手机流量统计

2016-01-27

Hadoop实战++第2版.pdf 高清扫描带书签 免费下载

hadoop实战 第二版 带书签 免费下载

2016-01-22

jd-gui jar反编译工具 免费下载

jar包的 最好用的 反编译工具 绿色免安装

2016-01-22

commons-logging-1.1.1.jar免费下载

commons-logging-1.1.1-bin.zip jar包

2016-01-22

commons-lang-2.6.jar

commons-lang-2.6-bin.zip jar包

2016-01-22

commons-configuration-1.9.jar

commons-configuration-1.9.jar jar包

2016-01-22

commons-cli-1.0.jar

commons-cli-1.0.jar Apache Commons CLI library为用户提供了一个解释命令行的API.它在解释命令行时主要有三个状态,即:定义、解释和询问交互

2016-01-22

hadoop-core.jar 已修改权限 windows可用

已经修改了权限的hadoop-core的jar包 针对 Hadoop Failed to set permissions of path 的错误处理

2016-01-22

winScp免费下载

从windows主机向linux虚拟机传文件的工具

2016-01-22

mysql-connector-java-5.1.10.jar 免费下载

eclipse或myeclipse 中连接mysql 的必备jar包

2016-01-21

ant.jar 亲测可用

ant.jar Apache Ant,是一个将软件编译、测试、部署等步骤联系在一起加以自动化的一个工具,大多用于Java环境中的软件开发。由Apache软件基金会所提供。

2016-01-21

eclipse的SVN插件 1.8.22

eclipse myeclipse 可用的svn插件 版本1.8

2015-10-29

基于java的21点纸牌游戏代码

21点(黑杰克)纸牌游戏java实现 有界面 可以下注 洗牌 抓牌等

2015-10-29

蚂蚁爬行问题源码

用java实现的蚂蚁爬行问题 有界面 5只蚂蚁从一根杆子上的5个初始位置爬行,方向随机,相遇则回头,计算最大时间和最小时间

2015-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除