自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

独家 安装 Hadoop 2.0.0-cdh4.3.0 LZO 成功

在经历过忍饥挨饿、老眼昏花的深夜加班,最后扛不住没搞定,今天周六,再次来从新梳理思路和审核每一步操作,最终苍天终不负,让我搞定了LZO的安装,使集群间lzo文件的对拷和读写成为现实。期间,重启集群不下30遍,甚至一度丢掉了所有文件(测试环境),重新格式化。真心不容易,同时我很喜悦!因此,只要坚持和努力,结果不会令人太失望!言归正传,把我安装的过程记录一下,以备下次再安装时,我就驾轻就熟了。...

2013-08-31 11:42:01 168

原创 lzo悲催的安装

java.lang.UnsatisfiedLinkError: no gplcompression in java.library.pathat java.lang.ClassLoader.loadLibrary(ClassLoader.java:1738)at java.lang.Runtime.loadLibrary0(Runtime.java:823)at java.lang....

2013-08-30 19:23:15 267

对比测试 Snappy+RCFile组合 与 LZO+TextFile组合 的压缩比和查询性能

        在hadoop领域,上T数据的存储和处理是非常常见的。不同的存储格式和压缩组合能为存储和性能带来效率。本次对比测试 Snappy+RCFile组合 与  LZO+TextFile组合 的压缩比和查询性能,其结果见下面两个截图。至于hive、mr、压缩、存储格式等,这里不赘述,就在iteye搜索一下,都会出来一大堆。  ...

2013-06-04 09:25:29 354

发飙的房价

        北京五环、六环开外,房价已经逐渐飙升至2w以上了,今天去偏远的房山看了一遍,与今年1月相比,上涨了30%,超过2w的楼盘多得的去了,相反低于2w的,已经屈指可数了,尽管那边有些楼盘周边还很荒凉,但是依然不能成为不涨的理由。正如小杂货店的录音机冒出来的:机不可失时不再来,你买不了上当,买不了吃亏。        尼玛,这对刚需一族是种摧残啊。          安心...

2013-06-01 21:33:38 102

EMC Hawq安装问题,Greeplum安装问题

Hawq的安装遇到以下问题,谁能解答一下??20130527:10:00:05:213181 gpstart:bdp6:gpadmin-[ERROR]:-ExecutionError: 'non-zero rc: 1' occured.  Details: 'ssh -o 'StrictHostKeyChecking no' bdp7 ". /usr/local/hawq/./greenplum_...

2013-05-28 09:23:13 267

鸟巢龙形水系钓鱼

        哈哈哈,我花了146元的准豪华装备,今天5点不到就去钓鱼,直到7点,收获是一条两手指大的鲫鱼和4条小指大的麻公鱼,哈哈哈,最后还全部赠送给了同行的钓友。        鸟巢的水系里真是物种丰富,鲤鱼、红鲤鱼、鲫鱼、乌龟、泥鳅、小虾、青蛙等什么都有。今天在我脚边的就有只乌龟,起初只看到它伸出水面头,还以为是蛇,要是在老家那边的河里发现这样的团鱼,那肯定是野的,宝贝啊。   ...

2013-05-25 14:00:03 245

impala的最大优势亦即最大致命弱点,并不像cloudera描述的那么强大

        impala的最大优势,也是它最大致命弱点。它将要处理的数据全部(有一定的优化和加载规则)加载至内存,在内存中实现数据处理,在所处理的数据较小时,其性能非常显著,但是当数据很大时,它就慢如蜗牛,甚至崩溃,在此时,它远不如hive+mapreduce。        今天的测试:       Impala简单测试汇总:        一、软件环境:      ...

2013-05-24 11:23:20 1318

钓鱼,有人一起吗

        啊,为了暂时总结无聊的周末,哈哈哈,我今天买了鱼杆,“霸王3.6米+换把+竿桶+赠品”才85块钱,值得啊。下周去鸟巢的龙形水系里钓鱼去,有人一起吗???        平时晚上也可以去,反正我看那早晚很多人在那钓鱼,没人管,只要白天不去就行。钓些小鲫鱼,还是不错的。        奥林匹克森林公园里的鱼比较大,有大草鱼、鲤鱼、金鱼等,但是好像没人在那钓,管的严啊,哈哈...

2013-05-19 10:39:20 154

Phoenix V1.1 分析与测试

  Phoenix可用性测试报告——种基于HBase的SQL中间层开源插件         目录1.文档说明41.1编写目的41.2适用范围41.3参考资料41.4测试目的52.测试说明52.1测试类型52.2硬件环境52.3软件环境52.4部署环境53.测试结果及分析63.1测试类型63...

2013-05-18 14:37:06 285

Hive可视化日志web方案的实现

2. 接口数据协议IDE基于Hive部分约定的数据调用约定。2.1 HQL语法约定该部分的HQL由Web Server提交至Hive Server端执行。根据Hive的特点,除了执行部分SELECT语句会启动MapReduce外,其他如alter、load、insert语句等都不会涉及M/R。由此可知,大部分情况下不会有MapReduce的执行过程日志输出,而目前I...

2013-05-18 14:33:04 565 1

无聊的周末

         在这天气不好,空气质量不高的周末,大家会做什么?分享一下吧。          曾经我会看书、电影、一个人去爬山、逛公园、看别人下象棋、和朋友吃饭、喝酒、KTV、台球等,但是至去年以来就很少这样了,难道我老了吗??还是对日复一日没有新意的生活乏味了,总是似乎缺少了一些令我期待、感动和开心的事,所以周末干什么都好像缺少激情了。          大伙呢?在忙碌一周...

2013-05-18 08:58:47 171

hadoop资源调度器

         hadoop支持多用户环境,在生产环境中,往往一个大的hadoop集群,供多个应用如Hive,Mahout等之类的使用。在多用户环境下,有的用户提交的工作量很大、很频繁,而有的很少,还有的优先级很高,那么如何保证“按需”来为各个用户分配资源(内存、CPU、带宽、IO、磁盘)呢?这就需要用到资源调度器。        这里,我对hadoop的资源调度做个简单的归纳总结: ...

2013-05-17 17:07:55 195

Impala V1.0安装之lzo

        Impala是个什么东西?主要解决什么领域的问题?它有什么特征等等这里不想赘述。只讲解安装impala release版安装中的一个小节。        关于impala的安装,随便百度、谷歌一下,都会出来漫天的安装说明,不过大部分都是转载的,也都是一些beta版,毫无创新。另外,impala官方cloudera的网站也有impala的多类文档,但是,在某些地方取描述不尽详尽...

2013-05-16 11:33:25 162

rmr事故

          今天我也奇葩了一把,因一个失误,酿成从业6年以来最严重的工作灾难事故。本来今天完成跨HDFS版本数据迁移和1.0IMPALA-LZO是非常值得我高兴的事情,却因在线上环境和测试环境之间迁移数据时,本该删除测试环境的,不小心递归删除了在线数据仓库的一个大目录,造成海量数据丢失,造成难以评估的结果。尼玛,老子人品暴跌吗?       一再提醒自己细心处理在线事务,却还是...

2013-05-15 22:23:52 124

自开发跨HDFS版本的拷贝工具

        虽然HDFS提供了distcp的远程拷贝工具,在同版本之间拷贝很方便,功能也很强大。但是,在跨版本、跨 运维机制时,它就不可用了。另外,HDFS也专门为跨版本提供了hftp协议,提供只读功能,但是该功能也有个致命缺陷,即需要配置被拷贝集群的所有节点的hosts,因为这个协议走的是HDFS的web管理接口,里面每个数据节点都是以hostname对外提供服务,所以,不配置hosts是...

2013-05-15 11:29:34 142

2013年5月15,开博,记录我的工作、学习和生活

从今天开始开博,记录我的成长历程。[b]一个大数据领域的探索者[/b]

2013-05-15 10:26:09 77

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除