自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

来啊 快活啊

不但唱工,单是黑头涎脸扮丑角,丑角挺胸学黑头,戏场上只见白鼻子的和黑脸孔的丑角多起来,也就滑天下之大稽。——(鲁迅《花边文学·小品文的生机》)

  • 博客(44)
  • 资源 (8)
  • 收藏
  • 关注

原创 手工安装配置Cloudera组件-Impala

安装Impala1.在所有节点安装Impala base2.在集群中安装一个impala-catalog和impala-state-store3.在所有datanode节点安装impala-server4.在部分节点安装impala-shell5.安装其他需要的组件6.环境变量的设置在/etc/defa

2014-08-31 10:24:15 1515

原创 手工安装配置Cloudera组件-hive

安装Hive1.yum安装Hive base2.yum安装hive-metastore3.yum安装hive-server2(可多客户端并发)/hive-server(不可并发)4.安装其他需要的组件,可用yum search模糊匹配下,查看有没有想要安装的组件5.环境变量的设置在/etc/default/hive*文

2014-08-31 10:20:07 1069

原创 手工安装配置Cloudera组件-Hadoop

安装repohttp://archive-primary.cloudera.com/cdh/存放着cdh1-3的所有文件http://archive-primary.cloudera.com/cdh4/存放着cdh4的所有文件http://archive-primary.cloudera.com/cdh5/存放着cdh5的所有文件安装可以先从上边的地址下载对应的R

2014-08-31 10:12:07 1973

原创 执行Cloudera相关命令时出现JAVA_HOME not set

[root@impalaa init.d]# service hadoop-hdfs-namenode startStarting Hadoop namenode:[ OK ]Error: JAVA_HOME is not set and could not be found.[root@impalaa init.d]# find / -name hadoop-env.sh/usr/l

2014-08-30 11:25:10 6364

原创 Sqoop2编译时出现java.lang.NoClassDefFoundError: org/sonatype/aether/graph/DependencyFilter

1.编译到docs的时候,出现下面的错误java.lang.NoClassDefFoundError: org/sonatype/aether/graph/DependencyFilter at java.lang.Class.getDeclaredConstructors0(Native Method) at java.lang.Class.privateGe

2014-08-26 10:22:25 3356

原创 NativeCodeLoader: Unable to load native-hadoop library for your platform

至今为止,搭建的所有集群里都有这个错误:

2014-08-24 17:56:24 18403 13

原创 Exception from container-launch: org.apache.hadoop.util.Shell$ExitCodeException

新搭建了个集群,搭建完了,运行2014-08-24 02:24:02,456 INFO org.apache.hadoop.yarn.server.resourcemanager.rmapp.RMAppImpl: Application application_1408860487557_0002 failed 2 times due to AM Container for appat

2014-08-24 15:26:58 14917 1

原创 HDFS Rolling Upgrade

HDFS Rolling UpgradeIntroductionHDFS 滚动升级允许单独升级每一个HDFS进程。例如,DataNode可以独立于NameNode升级。一个NameNode可以独立于其他的NameNode升级。NameNode可以独立于DataNode和JournalNode升级。Upgrade在Hadoop V2中,HDFS支持NameNode服务的HA和前后兼容

2014-08-22 10:35:19 2724

原创 HDFS NFS Gateway

HDFS NFS GatewayOverviewNFS Gateway支持NFSv3,允许HDFS作为客户端本地文件系统的一部分挂载在本地文件系统。目前,NFS Gateway支持和启用了下面的使用模式:1.用户可以在基于NFSv3客户端兼容的操作系统上的本地文件系统上浏览HDFS文件系统。2.用户可以从挂载到本地文件系统的HDFS文件系统上下载文件。3

2014-08-21 16:45:33 14858

原创 dfs.datanode.max.xcievers

dfs.datanode.max.xcievers 256dfs.datanode.max.xcievers 对于datanode来说,就如同linux上的文件句柄的限制,当datanode 上面的连接数操作配置中的设置时,datanode就会拒绝连接。一般都会将此参数调的很大,40000+左右。

2014-08-21 14:36:10 8990

原创 Cloudera Manager安装集群注意记录

1.千万不要删除hosts文件里关于localhost的配置2.安装完之后无法打开7180端口的网址,防火墙开着呢3.安装老失败,看日志是找不到archive.cloudera.com,在host文件加了nameserver 8.8.8.8,就好了。这是谷歌的DNS地址4.Host inspector 过程生成的文件/var/run/cloudera-scm-agent/process

2014-08-21 14:32:20 5208

原创 Hadoop指标框架V2

Package org.apache.hadoop.metrics2 Metrics 2.0Interface SummaryMetricsCollectorThe metrics collector interfaceMetricsInfoInterface to provide immutable meta info for

2014-08-21 14:27:55 2210

原创 Hadoop指标框架 V1

Package org.apache.hadoop.metrics这个包定义了一个用来报告性能测量的信息的API。描述这个包定义了一个用来报告性能测量的信息的API。API是抽象的,这样它就可以被各种度量客户机库实现。客户端的选择是可以配置的,同一个应用程序的不同模块可以用不同的指标实现库。子包org.apache.hadoop.metrics.spi抽象的服务接口

2014-08-21 14:22:06 1093

原创 Hadoop2.4.1编译记录

1.环境说明[code lang="xml"]centos6.4 64bit[/code]2.更新系统安装包[code lang="xml"]yum update[/code]3.安装[code lang="xml"]yum -y install svn git ncurses-devel gcc* lzo-devel zlib-devel autoconf

2014-08-21 14:16:55 1555

原创 HDFS多用户时的权限问题

今天用Cloudera Manager安装Hive时老不成功,不能初始化数据库表,遇到很多问题,最后手工初始化,解决的,但是挡在hive命令行执行写入类命令比如创建数据库或表时出现以下问题:[code lang="xml"]14/07/23 01:07:14 ERROR hive.log: Got exception: org.apache.hadoop.security.Acce

2014-08-21 14:06:52 11734

原创 Hadoop Archive管理大量小文件

1.usage[code lang="xml"]1.usage[code lang="xml"][hadoop@hadoop1 ~]$ hadoop archivearchive -archiveName NAME -p * [/code]2.use case:Archive[code lang="xml"][hadoop@hadoop1 ~]$ hadoop

2014-08-21 13:59:41 1585

原创 NameNode多次Format后DataNode无法启动的问题

1.NameNode格式化两次后,DataNode无法启动,查看日志,有如下错误:[code lang="java"]2014-07-06 08:22:40,506 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for block pool Block pool (Datanode

2014-08-21 13:47:58 5653 2

原创 HDFS多硬盘挂载

环境说明9个节点,7个DataNode,每个DataNode有3块硬盘,两块是后来加的,挂载在系统所在文件系统。hdfs-site.xml配置[code lang="xml"] dfs.datanode.data.dir /home/hadoop/develop/hadoop/hdfs/data, /home/hadoop/develop

2014-08-21 13:46:34 10327

原创 Centralized Cache Management in HDFS

Centralized Cache Management inHDFSOverviewHDFS中的集中式缓存管理是一个显式的管理缓存的机制,它允许用户指定被HDFS缓存的路径。NameNode将与磁盘上有所需的Block的DataNode通信,命令其在堆外缓存里缓存Block。HDFS中的集中式缓存管理有许多重要的优势。1.明确地防止频繁使用的数据被赶出内存。当工作集的

2014-08-21 13:30:24 2327

原创 HDFS Short-Circuit Local Reads

HDFS Short Circuit Local ReadsBackgroundHDFS中,读操作通常通过DataNode。因此,当一个客户端访问DataNode读一个文件的时候,DataNode从磁盘中读出该文件,然后通过TCK Socket发送到客户端。所谓的“short-circuit”是绕开DataNode,允许客户端直接读一个文件。明显地,当客户端与数据在同一地点时可能会出现这种

2014-08-21 09:09:02 10329

原创 Hadoop HDFS over HTTP 2.4.1 - Using HTTP Tools

Security开箱即可用的HttpFS既支持pseudo认证,也支持Kerberos HTTP SPNEGO认证。Pseudo Authentication用Pseudo认证时,用户名必须在HttpFS URL的查询参数里通过user.name=指定。例如:$ curl"http://:14000/webhdfs/v1?op=homedir&user.name=babu"Ke

2014-08-20 17:14:18 1054

原创 Hadoop HDFS over HTTP 2.4.1 - Server Setup

Hadoop HDFS over HTTP 2.4.1 -Server Setup本篇文章介绍了如何快速建立一个带Pseudo认证的HttpFS。RequirementsJava 6+ Maven 3+Install HttpFS~ $ tar xzfhttpfs-2.4.1.tar.gzConfigure HttpFS默认情况下,HttpFS假设Hadoop的配

2014-08-20 16:47:29 1491

原创 Hadoop HDFS over HTTP

Hadoop HDFS overHTTP-Documentation Sets2.4.1HttpFs是一个提供REST HTTP的方式支持所有的HDFS文件系统操作的方式。它与webhdfsREST HTTP API彼此协作。HttpFS可以被用来在运行不同版本的Hadoop集群间传递数据(克服了RPC版本不同的问题),例如使用HadoopDistCP工具。HttpFS可以被用来访问有

2014-08-20 15:30:03 2117

原创 WebHDFS REST API

Document ConventionsMonospacedUsed for commands, HTTP request and responses and code blocks.User entered values.[Monospaced]Optional values. When the va

2014-08-20 14:30:25 5624

原创 C API libhdfs

C API libhdfsOverviewLibhdfs是一个基于C的HDFS的JNI。它为一部分HDFS的API提供了一个C的 API,以使用C来管理HDFS文件和文件系统。Libhdfs是Hadoop发行版的一部分,预编译文件是$HADOOP_PREFIX/libhdfs/libhdfs.so。The APIsLibhdfs APIs是下面的一部分:Libhdfs的头文件

2014-08-19 14:14:05 2249

原创 HFTP Guide

HFTP GuideIntroductionHDFS是一个可以让你从远程HDFS集群读取数据的Hadoop文件系统的实现。数据读取通过HTTP,数据都在DataNode上。HFTP是一个只读的文件系统,如果你试图用它写或者修改文件系统的状态,将会抛出一个错误。如果你用多个不同版本的HDFS集群,然后你需要在集群之间移动数据的话,HFTP是非常有用的。HFTP在不同HDFS版本之间都是兼

2014-08-19 13:23:42 2024

原创 HDFS Quotas Guide

HDFS Quotas GuideOverviewHDFS允许管理员为多个每个目录设置使用的命名空间和空间的配额。命名空间配额和空间配额独立操作,但是这两种类型的配额的管理和实现非常类似。Name Quotas命名空间配额是一个目录树中该目录下的文件和子目录数量的硬限制。如果超出配额,文件和目录会创建失败。配额会与重命名的目录保持联系。如果重命名操作导致违反配额限制,操作将会失败。

2014-08-19 11:49:45 1048

原创 HDFS Permissions Guide

HDFS Permission GuideOverviewHDFS实现了一个文件和目录权限模型,拥有很多POXIS模型的影子。每个文件和目录与一个所有者和一个用户组相关联。文件或目录有各自的用户权限,用户包括所有者,所有者同组的其他用户,所有其他的用户。对于文件来说,r权限代表读文件,w权限代表写或者追加数据到文件。对于目录,r表示可以列出目录的内容,w权限代表可以创建或者删除文件或目录,

2014-08-19 10:25:24 2372

原创 Offline Image Viewer Guide

Overview离线Image查看器是一个将HDFS FsImage文件的内容以人类可读的格式输出以允许离线的分析和检查一个Hadoop集群的命名空间。这个工具能够相当快速地处理非常大的image文件,将其转换为几个输出格式中的一个。这个工具在Hadoop版本16之后被增加以处理布局格式。如果此工具不能够处理一个image文件,它将干净地退出。离线Image查看器不需要Hadoop集群正在运行

2014-08-18 12:45:12 1492

原创 Offline Edits Viewer Guide

Offline Edits Viewer GuideOverview离线的Edits查看器是一个解析Editslog文件的工具。当前程序需要用于不同格式的转换,包括人类可读的和比本地二进制格式更易编辑XML文件。此工具可以解析Hadoop0.18和机器之后版本的edits格式。这个工具只操作文件,不需要Hadoop集群正在运行。数据格式支持:1.Binary:Had

2014-08-18 10:32:33 1299

原创 HDFS Architecture

HDFS ArchitectureIntroductionHDFS是分布式文件系统,它被设计为运行在普通商用硬件之上。它与已经存在的文件系统有很多相似性。但是,也有巨大的不同。HDFS有很高的容错,被设计为部署在低廉的硬件上。HDFS提供为应用程序的数据提供一个高通量的访问,适合有大量数据的应用程序。HDFS放松了一些POSIX的需求,以使可以用流的方式访问文件系统的数据。HDFS最初作为

2014-08-17 16:48:31 1876

原创 HDFS Snapshots

概述HDFS快照是只读的文件系统的时间点的复制。快照可以照文件系统的一部分或者整个文件系统。快照的常见用例是数据备份,防止用户错误和灾难恢复。HDFS快照的实现是高效的:1.快照的创建时瞬间的:包括inode查找的时间,代价是O(1)。2.只有在有相对于快照的修改是才耗费内存:内存使用时O(M),M是修改的文件/目录的数量。3.快照不会影响正

2014-08-17 11:11:06 1238

原创 JAAS Authentication Example

例子程序来源于Java文档。1. 配置Kerberos的Server端,配置KDC(kdc.conf)和Server(krb5.conf)。2. 增加一个Principal,一个用于程序测试。3. 将JassAcn.java和Jaas.conf文件拷贝到一个文件夹。4. Javac编译JassAcn.java文件5. 用下面的命令执行class文件,替换成自己的配置

2014-08-16 14:41:44 2015

原创 JAAS Authorization文档

本指南扩展了在JAAS Authentication文档中的程序和policy文件,展示了JAAS Authorization组件,这个组件确保被认证的调用者对后续的安全敏感的操作有访问控制的权利(权限)。因为授权组件首先需要用户认证操作完成,请先阅读JAAS Authentication的doc。本教程剩下的部分包含目录列出的内容:如果你想先看下教程代码的运行,你可以直接跳到运行代码的部

2014-08-16 14:35:01 2961

原创 Jaas Authentication文档翻译

JAAS AuthorizationJava认证和授权服务是Java 2中的一个可选包。JAAS被用来实现两个目的:1.用户认证,为了可靠和安全的确认当前谁在运行Java代码,不管代码是以一个程序运行,还是一个applet,一个bean或者一个servlet。2.用户的授权,确保他们对需要执行的动作有访问控制的权利(权限)。这个部分提供了一个认证组件的初

2014-08-16 14:14:57 2125

原创 HDFS ViewFs配置

1.core-site.xml文件 fs.defaultFSviewfs://mycluster dfs.journalnode.edits.dir/home/hihadoop/hadoop/jns

2014-08-15 08:21:25 3013

原创 HDFS HA+Federation配置

两个nameservice,ns1和ns2,有两个高可用的NameNode。1.core-site.xml文件 fs.defaultFS hdfs://ns1 dfs.journalnode.edits.dir /home/hihadoop/hadoop/jns

2014-08-15 08:18:49 1730

原创 ViewFs Guide

简介文件浏览系统(ViewFs)提供了一个管理多个Hadoop文件系统命名空间(或者叫Namespace Volume)的方式。它对于有多个NameNode的联邦集群特别有用。ViewFs与Unix/Linux系统中client side mount tables类似。ViewFs可被用来创建个人命名空间视图,也可以每个集群一个公共的试图。本指南描述了,在有多个集群的Hadoop系统中,每

2014-08-15 08:18:14 2308

原创 Hadoop 2.5.0新特性和改进

Apache Hadoop 2.5.0是一个在2.x.y发布线上的一个小版本,建立在之前稳定的发布版本2.4.1之上。主要特性和改进:1.Commona)使用HTTP代理服务器时认证改进。当通过代理服务器使用WebHDFS时这是非常有用的。b)增加了一个新的Hadoop指标监控sink,允许直接写到Graphite。c)

2014-08-13 16:03:12 3723 3

原创 HDFS Federation

HDFS联邦本指南提供了一个HDFS联邦特性的综述,以及如何配置和管理联邦的集群。背景HDFS有两个主要的层次:1.Namespacea)包含很多的目录,文件和blockb)他提供所有的文件系统操作像创建,删除,修改该和list文件和目录的命名空间2.Block Storage Service有两个部分a)

2014-08-13 13:57:43 1306

exactly once semantics in kafka

exactly once semantics in kafka,

2019-02-27

Exactly Once Delivery and Transactional Messaging in Kafka

Exactly Once Delivery and Transactional Messaging in Kafka

2019-02-27

领域驱动设计精要

领域驱动设计精要,DDD大神的神作,5个资源分,你买不了吃亏,买不了上当

2017-11-04

后台框架H+的最新版本

后台框架H+的最新版本,感觉比ace实用一些

2016-01-30

hadoop2.4.1 Eclipse插件

hadoop2.4.1的Eclipse插件 直接放到Eclipse plugin目录下重启Eclipse就能用了

2014-10-31

快学Scala(Java核心技术的作者最新力作)

这本书,出自《Java核心技术》(Core Java)的作者,Cay S. Horstmann。每一章的篇幅都不长,娓娓道来,沁人心脾,适合有一定经验的Java程序员阅读。几乎所有Scala相关的核心内容都有涉及,由浅入深,深入浅出,非常适合快速上手。 当然了,如果你想要用好Scala,想把它发挥到更高的层次,基本功必须扎实。这本书讲的都是基本招式,看似平实无华,实则招招受用,对于一线开发人员,实在是值得放在案头反复揣摩练习。 Cay S. Horstmann是《Java核心技术》卷1和卷2第8版(Sun Microsystems出版社2008年出版)的主要作者,除此之外,他还著有其他十多本面向专业程序员和计算机科学专业学生的书籍。他是San Jose州立大学计算机科学专业的教授,同时还是一位Java Champion。

2014-09-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除