- 博客(23)
- 资源 (17)
- 收藏
- 关注
转载 解析Cloudera Manager内部结构、功能包括配置文件、目录位置等
问题导读1.CM的安装目录在什么位置?2.hadoop配置文件在什么位置?3.Cloudera manager运行所需要的信息存在什么位置?4.CM结构和功能是什么?1. 相关目录/var/log/cloudera-scm-installer : 安装日志目录。/var/log/* : 相关日志文件(相关服务的及CM的)。/u
2014-11-26 13:09:22 2269
转载 卸载 Cloudera Manager 5.1.x.和 相关软件【官网翻译:高可用】
卸载 Cloudera Manager 5.1.x.和 相关软件【官网翻译:高可用】----存储,学习,共享问题导读:1.不同的安装方式,卸载方法存在什么区别?2.不同的操作系统,卸载 Cloudera Manager Server and 数据库有什么区别?重新安装不完整如果你来到这里,因为你的安装没有完成(例如,如果它是由一个虚拟机超时中断),和你想继续安装
2014-11-26 12:51:40 1747
转载 Cloudera Manager5及CDH5安装指导(终极在线安装)
Cloudera Manager5及CDH5安装指导(终极在线安装)-----存储,学习,共享问题导读:1.Cloudera Manager5安装需要哪些环境要求?2.哪些Linux系统上,可以安装Cloudera Manager5?3.在安装cdh的过程中,该如何选择版本?安装环境要求集群中的四台主机必须满足以下要求:主机必须至少有10 GB的RA
2014-11-26 12:49:21 21113 1
转载 Sqoop导入关系数据库到Hive
Sqoop导入关系数据库到Hive存储,xu Sqoop 是 apache 下用于 RDBMS 和 HDFS 互相导数据的工具。本文以 mysql 数据库为例,实现关系数据库导入到 hdfs 和 hive。1. 安装 Sqoop使用 rpm 安装即可。yum install sqoop sqoop-metastore -y安装完之后需要下载
2014-11-21 13:23:59 2201
转载 flume介绍及原理总结
flume介绍及扩展开发心得一二 存储,学习,共享一、flume简介Flume是Cloudera提供的日志收集系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种storage。Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。上图的Flume
2014-11-20 08:56:23 16064 1
转载 Hadoop Hive sql语法详解
Hadoop Hive sql语法详解存储,学习,共享 Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需要的
2014-11-18 16:28:06 1274
转载 MySQL 5.6内存占用过高解决方案
MySQL 5.6内存占用过高解决方案作者:reizhi 发布:2013-12-25 22:55 栏目:原创, 数码, 软件 阅读:1,889次 抢沙发 距离MySQL 5.6正式发布已经有比较长的时间了,目前Oracle官网上的最新GA版本MySQL server也为5.6。但reizhi在安装配置后却发现其内存占用居高不下,无论如
2014-11-14 15:55:38 56805 3
原创 CDH cloudera-manager-installer.bin 安装过程
下载:http://www.cloudera.com/content/cloudera/en/downloads/cloudera_manager/cm-5-2-0.html
2014-11-11 16:32:22 5496
转载 HBase基本数据操作详解
HBase基本数据操作详解【完整版,绝对精品】存储,xue'x原文: http://blog.csdn.net/u010967382/article/details/37878701引言之前详细写了一篇HBase过滤器的文章,今天把基础的表和数据相关操作补上。本文档 参考最新 (截止2014年7月16日)的 官方 Ref Guide、 Develo
2014-11-11 14:35:36 67039 5
转载 Impala是如何提升3~90倍查询效率的
Impala是如何提升3~90倍查询效率的?存储,学习,共享ImpalaHadoop大数据Cloudera开源性能优化摘要:这篇文章是对Impala团队工程师Nong Li的blog——《Inside Cloudera Impala: Runtime Code Generatio》的翻译稿。文中讨论了Cloudera是如何使用生成runtime代码来提升CPU的效率和节省查
2014-11-10 12:46:24 2563
转载 Cloudera释放Impala 1.0:与Hadoop完全整合,各方面完爆Hive
Cloudera释放Impala 1.0:与Hadoop完全整合,各方面完爆Hive存储,学习,共享云计算大数据HadoopClouderaImpala摘要:Cloudera于近日释放了Impala 1.0版本,新的版本实现与Hadoop的完全整合,支持ANSI-92 SQL所有子集。Hive更是再次躺枪——在与Hive的对比中,Impala并发客户端处理的速度上甚至超越了
2014-11-10 12:37:45 1201
转载 什么是impala,如何安装使用Impala
nettman273主题479帖子2670积分超级版主积分2670收听TA发消息电梯直达楼主本帖最后由 nettman 于 2014-9-30 00
2014-11-10 12:35:41 6966
转载 Impala:新一代开源大数据分析引擎
Impala:新一代开源大数据分析引擎发表于ClouderaImpalaHadoopDremelParquetSharkDrill大数据摘要:大数据处理是云计算中非常重要的领域,自Google公司提出MapReduce分布式处理框架以来,以Hadoop为代表的开源软件受到越来越多公司的重视和青睐。本文将讲述Hadoop系统中的一个新成员:Impala。I
2014-11-10 12:24:43 808
转载 使用hive来分析flume收集的日志数据
flume学习(六):使用hive来分析flume收集的日志数据 存储,学习,分享前面已经讲过如何将log4j的日志输出到指定的hdfs目录,我们前面的指定目录为/flume/events。如果想用hive来分析采集来的日志,我们可以将/flume/events下面的日志数据都load到hive中的表当中去。如果了解hive的load da
2014-11-06 11:45:37 4521
转载 使用shell+awk完成Hive查询结果格式化输出
使用shell+awk完成Hive查询结果格式化输出存储,学习,共享好久不写,一方面是工作原因,有些东西没发直接发,另外的也是习惯给丢了,内因所致。今天是个好日子,走起!btw,实际上这种格式化输出应该不只限于某一种需求,差不多是通用的。需求:--基本的:当前Hive查询结果存在数据与表头无法对齐的情况,不便于监控人员直接查看,或者导出到excel中,需要提供一个脚本,将查
2014-11-06 11:12:58 3234 1
转载 Hive Operators and User-Defined Functions (UDFs) hive 日期函数
Hive Operators and User-Defined Functions (UDFs)Hive Operators and User-Defined Functions (UDFs)Built-in OperatorsRelational OperatorsArithmetic OperatorsLogical OperatorsComplex T
2014-11-06 10:51:49 2750
转载 hive优化方式和使用技巧
hive优化方式和使用技巧存储,学习,fen'x部分内容出处:http://www.atatech.org/article/detail/5617/0http://www.atatech.org/article/detail/4392/515 一.UDFS函数介绍1. 基本UDF(1)SHOWFUNCTIONS:这个用来熟悉未知函数。 DESCR
2014-11-06 10:49:35 1587
转载 最新版本的Hive 0.13发布,增加ACID特性
最新版本的Hive 0.13发布,增加ACID特性存储,学习,共享发表于2014-04-23 08:16| 3735次阅读| 来源Cwiki| 2 条评论| 作者Alan Gates大数据ACIDHiveHadoop摘要:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为
2014-11-06 09:28:25 988
转载 hive操作create,alter等
hive操作create,alter等存储,学习,共享Hive 的官方文档中对查询语言有了很详细的描述,请参考:http://wiki.apache.org/hadoop/Hive/LanguageManual ,本文的内容大部分翻译自该页面,期间加入了一些在使用过程中需要注意到的事项。Create TableCREATE [EXTERNAL] TABLE [IF NO
2014-11-05 14:53:36 856
转载 hive从查询中获取数据插入到表或动态分区
hive从查询中获取数据插入到表或动态分区存储,学习,分享Hive的insert语句能够从查询语句中获取数据,并同时将数据Load到目标表中。现在假定有一个已有数据的表staged_employees(雇员信息全量表),所属国家cnty和所属州st是该表的两个属性,我们做个试验将该表中的数据查询出来插入到另一个表employees中。INSERT OVERWRITE T
2014-11-05 13:55:29 1171
转载 hive查询优化总结
hive查询优化总结 存储,学习,分享一、join优化 Join查找操作的基本原则:应该将条目少的表/子查询放在 Join 操作符的左边。原因是在 Join 操作的 Reduce 阶段,位于 Join 操作符左边的表的内容会被加载进内存,将条目少的表放在左边,可以有效减少发生内存溢出错误的几率。 Join查找操作中如果存在多个join,且所有参与join的表中
2014-11-05 10:00:18 2160
转载 HIVE中join、semi join、outer join举例详解
HIVE中join、semi join、outer join举例详解收藏,学习,共享举例子:hive> select * from zz0; 111111 222222 888888 hive> select * from zz1; 111111 333333 444444 888888hive> select * from zz0 join z
2014-11-05 09:51:29 861
新华字典 2014版 Access数据库
2017-01-12
7.7中文破解版.rar
2014-10-09
mysql-connector-java-5.1.31-bin.jar
2014-07-29
MySql常用命令总结
2013-12-20
Atlas部署及常见问题
2013-11-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人