2014年11月_wulantian

12月 11月 10月 09月 08月 07月 06月 03月 01月

转载解析Cloudera Manager内部结构、功能包括配置文件、目录位置等

问题导读1.CM的安装目录在什么位置？2.hadoop配置文件在什么位置？3.Cloudera manager运行所需要的信息存在什么位置？4.CM结构和功能是什么？1. 相关目录/var/log/cloudera-scm-installer : 安装日志目录。/var/log/* : 相关日志文件（相关服务的及CM的）。/u

2014-11-26 13:09:22 2269

转载卸载 Cloudera Manager 5.1.x.和相关软件【官网翻译：高可用】

卸载 Cloudera Manager 5.1.x.和相关软件【官网翻译：高可用】----存储，学习，共享问题导读：1.不同的安装方式，卸载方法存在什么区别？2.不同的操作系统，卸载 Cloudera Manager Server and 数据库有什么区别？重新安装不完整如果你来到这里，因为你的安装没有完成（例如，如果它是由一个虚拟机超时中断），和你想继续安装

2014-11-26 12:51:40 1747

转载 Cloudera Manager5及CDH5安装指导（终极在线安装）

Cloudera Manager5及CDH5安装指导（终极在线安装）-----存储，学习，共享问题导读：1.Cloudera Manager5安装需要哪些环境要求？2.哪些Linux系统上，可以安装Cloudera Manager5？3.在安装cdh的过程中，该如何选择版本？安装环境要求集群中的四台主机必须满足以下要求：主机必须至少有10 GB的RA

2014-11-26 12:49:21 21113 1

转载 Sqoop导入关系数据库到Hive

Sqoop导入关系数据库到Hive存储，xu Sqoop 是 apache 下用于 RDBMS 和 HDFS 互相导数据的工具。本文以 mysql 数据库为例，实现关系数据库导入到 hdfs 和 hive。1. 安装 Sqoop使用 rpm 安装即可。yum install sqoop sqoop-metastore -y安装完之后需要下载

2014-11-21 13:23:59 2201

转载 flume介绍及原理总结

flume介绍及扩展开发心得一二存储，学习，共享一、flume简介Flume是Cloudera提供的日志收集系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据;同时，Flume提供对数据进行简单处理，并写到各种storage。Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。上图的Flume

2014-11-20 08:56:23 16064 1

转载 Hadoop Hive sql语法详解

Hadoop Hive sql语法详解存储，学习，共享 Hive 是基于Hadoop 构建的一套数据仓库分析系统，它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据，可以将结构化的数据文件映射为一张数据库表，并提供完整的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行，通过自己的SQL 去查询分析需要的

2014-11-18 16:28:06 1274

转载 MySQL 5.6内存占用过高解决方案

MySQL 5.6内存占用过高解决方案作者：reizhi 发布：2013-12-25 22:55 栏目：原创, 数码, 软件阅读：1,889次抢沙发距离MySQL 5.6正式发布已经有比较长的时间了，目前Oracle官网上的最新GA版本MySQL server也为5.6。但reizhi在安装配置后却发现其内存占用居高不下，无论如

2014-11-14 15:55:38 56805 3

原创 CDH cloudera-manager-installer.bin 安装过程

下载：http://www.cloudera.com/content/cloudera/en/downloads/cloudera_manager/cm-5-2-0.html

2014-11-11 16:32:22 5496

原创 Hbase的TTL字段超时设置测试

在工作中，很多时候需要对表字段进行限定，例如限定一列的

2014-11-11 14:59:30 32065 2

转载 HBase基本数据操作详解

HBase基本数据操作详解【完整版，绝对精品】存储，xue'x原文： http://blog.csdn.net/u010967382/article/details/37878701引言之前详细写了一篇HBase过滤器的文章，今天把基础的表和数据相关操作补上。本文档参考最新（截止2014年7月16日）的官方 Ref Guide、 Develo

2014-11-11 14:35:36 67039 5

转载 Impala是如何提升3～90倍查询效率的

Impala是如何提升3～90倍查询效率的？存储，学习，共享ImpalaHadoop大数据Cloudera开源性能优化摘要：这篇文章是对Impala团队工程师Nong Li的blog——《Inside Cloudera Impala: Runtime Code Generatio》的翻译稿。文中讨论了Cloudera是如何使用生成runtime代码来提升CPU的效率和节省查

2014-11-10 12:46:24 2563

转载 Cloudera释放Impala 1.0：与Hadoop完全整合，各方面完爆Hive

Cloudera释放Impala 1.0：与Hadoop完全整合，各方面完爆Hive存储，学习，共享云计算大数据HadoopClouderaImpala摘要：Cloudera于近日释放了Impala 1.0版本，新的版本实现与Hadoop的完全整合，支持ANSI-92 SQL所有子集。Hive更是再次躺枪——在与Hive的对比中，Impala并发客户端处理的速度上甚至超越了

2014-11-10 12:37:45 1201

转载什么是impala，如何安装使用Impala

nettman273主题479帖子2670积分超级版主积分2670收听TA发消息电梯直达楼主本帖最后由 nettman 于 2014-9-30 00

2014-11-10 12:35:41 6966

转载 Impala：新一代开源大数据分析引擎

Impala：新一代开源大数据分析引擎发表于ClouderaImpalaHadoopDremelParquetSharkDrill大数据摘要：大数据处理是云计算中非常重要的领域，自Google公司提出MapReduce分布式处理框架以来，以Hadoop为代表的开源软件受到越来越多公司的重视和青睐。本文将讲述Hadoop系统中的一个新成员：Impala。I

2014-11-10 12:24:43 808

转载使用hive来分析flume收集的日志数据

flume学习（六）：使用hive来分析flume收集的日志数据存储，学习，分享前面已经讲过如何将log4j的日志输出到指定的hdfs目录，我们前面的指定目录为/flume/events。如果想用hive来分析采集来的日志，我们可以将/flume/events下面的日志数据都load到hive中的表当中去。如果了解hive的load da

2014-11-06 11:45:37 4521

转载使用shell+awk完成Hive查询结果格式化输出

使用shell+awk完成Hive查询结果格式化输出存储，学习，共享好久不写，一方面是工作原因，有些东西没发直接发，另外的也是习惯给丢了，内因所致。今天是个好日子，走起！btw，实际上这种格式化输出应该不只限于某一种需求，差不多是通用的。需求：--基本的：当前Hive查询结果存在数据与表头无法对齐的情况，不便于监控人员直接查看，或者导出到excel中，需要提供一个脚本，将查

2014-11-06 11:12:58 3234 1

转载 Hive Operators and User-Defined Functions (UDFs) hive 日期函数

Hive Operators and User-Defined Functions (UDFs)Hive Operators and User-Defined Functions (UDFs)Built-in OperatorsRelational OperatorsArithmetic OperatorsLogical OperatorsComplex T

2014-11-06 10:51:49 2750

转载 hive优化方式和使用技巧

hive优化方式和使用技巧存储，学习，fen'x部分内容出处：http://www.atatech.org/article/detail/5617/0http://www.atatech.org/article/detail/4392/515 一．UDFS函数介绍1. 基本UDF（1）SHOWFUNCTIONS：这个用来熟悉未知函数。 DESCR

2014-11-06 10:49:35 1587

转载最新版本的Hive 0.13发布，增加ACID特性

最新版本的Hive 0.13发布，增加ACID特性存储，学习，共享发表于2014-04-23 08:16| 3735次阅读| 来源Cwiki| 2 条评论| 作者Alan Gates大数据ACIDHiveHadoop摘要：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能，可以将SQL语句转换为

2014-11-06 09:28:25 988

转载 hive操作create，alter等

hive操作create，alter等存储，学习，共享Hive 的官方文档中对查询语言有了很详细的描述，请参考：http://wiki.apache.org/hadoop/Hive/LanguageManual ，本文的内容大部分翻译自该页面，期间加入了一些在使用过程中需要注意到的事项。Create TableCREATE [EXTERNAL] TABLE [IF NO

2014-11-05 14:53:36 856

转载 hive从查询中获取数据插入到表或动态分区

hive从查询中获取数据插入到表或动态分区存储，学习，分享Hive的insert语句能够从查询语句中获取数据，并同时将数据Load到目标表中。现在假定有一个已有数据的表staged_employees（雇员信息全量表），所属国家cnty和所属州st是该表的两个属性，我们做个试验将该表中的数据查询出来插入到另一个表employees中。INSERT OVERWRITE T

2014-11-05 13:55:29 1171

转载 hive查询优化总结

hive查询优化总结　　存储，学习，分享一、join优化　　Join查找操作的基本原则：应该将条目少的表/子查询放在 Join 操作符的左边。原因是在 Join 操作的 Reduce 阶段，位于 Join 操作符左边的表的内容会被加载进内存，将条目少的表放在左边，可以有效减少发生内存溢出错误的几率。　　Join查找操作中如果存在多个join，且所有参与join的表中

2014-11-05 10:00:18 2160

转载 HIVE中join、semi join、outer join举例详解

HIVE中join、semi join、outer join举例详解收藏，学习，共享举例子：hive> select * from zz0; 111111 222222 888888 hive> select * from zz1; 111111 333333 444444 888888hive> select * from zz0 join z

2014-11-05 09:51:29 861

新华字典 2014版 Access数据库

新华字典 2014版 Access数据库。新华字典是经过增补的2014版Access数据库，收录了两万多字，是mdb数据库，其中包括汉字、五笔、部首、笔画数、除部首笔画数、拼音、简解、详解，希望可以帮助有需要的人。

2017-01-12

MySQL Workbench for Mac 6.0.dmg

2016-10-18

apache-hive-0.13.1-bin.tar.gz

apache-hive-0.13.1-bin.tar.gz hive

2014-10-21

7.7中文破解版.rar

亿图7.7破解版，亲测可用。使用方法，先用edrawmax-cn.exe，然后使用Crack目录中的user.cfg覆盖安装目录下config文件夹中的同名文件；最后双击执行Crack目录中的addreg.reg，完美破解可用。测试过的，非常好用。拿出来共享给大家。

2014-10-09

mysql-connector-java-5.1.31-bin.jar

mysql-connector-java-5.1.31-bin.jar，mysql5.6.10的最新驱动下载

2014-07-29

以下是无意中在网络看到的使用MySql的管理心得, 在windows中MySql以服务形式存在，在使用前应确保此服务已经启动，未启动可用net start mysql命令启动。而Linux中启动时可用“/etc/rc.d/init.d/mysqld start”命令，注意启动者应具有管理员权限。刚安装好的MySql包含一个含空密码的root帐户和一个匿名帐户，这是很大的安全隐患，对于一些重要的应用我们应将安全性尽可能提高，在这里应把匿名帐户删除、 root帐户设置密码，可用如下命令进行： use mysql;

2013-12-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

wulantian的专栏