- 博客(16)
- 资源 (32)
- 收藏
- 关注
转载 hadoop2.2.0 搭建
第一部分 Hadoop 2.2 下载 Hadoop我们从Apache官方网站直接下载最新版本Hadoop2.2。官方目前是提供了linux32位系统可执行文件,所以如果需要在64位系统上部署则需要单独下载src 源码自行编译。下载地址:http://apache.claz.org/hadoop/common/hadoop-2.2.0/如下图所示,下载红色标记部分即可。
2013-10-31 22:30:45 1430
原创 Python脚本练习一
批量将指定目录下的所有文件中的$HADOOP_HOME$替换成/home/ocetl/app/hadoop#!/usr/bin/pythonimport osimport re#list filesdef listFiles(dirPath): fileList=[] for root,dirs,files in os.walk(dirPath):
2013-10-31 22:11:20 2680
原创 hadoop2.2.0 搭建初体验
下载 hadoop-2.2.0.tar.gztar-xzvf hadoop-2.2.0.tar.gzcdhadoop-2.2.0vietc/hadoop/hadoop-env.sh修改:export JAVA_HOME=/usr/local/jdk1.7.0_15vietc/hadoop/slaves修改localhost为hostmasterv
2013-10-31 22:01:37 1030
原创 java读取大文件1G+
正常读取大文件,可能会想到用缓存如:package base;import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;
2013-10-30 13:12:05 3250
转载 深入理解hadoop网络
原文地址 http://bradhedlund.com/2011/09/10/understanding-hadoop-clusters-and-the-network/本文侧重于Hadoop集群的体系结构和方法,以及它与网络和服务器基础设施这件的关系。文章的素材主要来自于研究工作以及同现实生活中运行Hadoop集群客户的讨论。如果你也在你的数据中心运行产品级的Hadoop集群,那
2013-10-29 22:35:18 893
原创 Hadoop Namenode 无法启动 总结一
一周之后重新启动虚拟机,打开hadoop准备写点东西,结果jps 只有三个节点启动了TaskTrackersecondNamenodeDataNode然后继续jps,过一会全部节点都死掉捣鼓了半天,没办法只有format,结果数据丢失了,幸亏是学习用的测试环境所以,一般这种情况,不要急于找自己的配置那里出问题了解决问题先找思路,先看看你的网络首先,检查能
2013-10-29 22:09:41 1159
转载 Hadoop MapReduce进阶 使用分布式缓存进行replicated join
概念:reduce-side join技术是灵活的,但是有时候它仍然会变得效率极低。由于join直到reduce()阶段才会开始,我们将会在网络中传递shuffle所有数据,而在大多数情况下,我们会在join阶段丢掉大多数传递的数据。因此我们期望能够在map阶段完成整个join操作。主要技术难点:在map阶段完成join的主要困难就是mapper可能需要与一个它自己不能获得的数据进行j
2013-10-29 19:04:09 778
转载 MapReduce提高效率的几点建议
Cloudera提供给客户的服务内容之一就是调整和优化MapReduce job执行性能。MapReduce和HDFS组成一个复杂的分布式系统,并且它们运行着各式各样用户的代码,这样导致没有一个快速有效的规则来实现优化代码性能的目的。在我看来,调整cluster或job的运行更像一个医生对待病人一样,找出关键的“症状”,对于不同的症状有不同的诊断和处理方式。 在医学领域,没有
2013-10-28 20:33:33 3933 1
转载 破解“无法复制粘贴”
如今在电脑的使用中经常碰到无法复制黏贴的问题,给资料的收集带来不少困难。近日,宇宙无意中看到了这篇文文,感觉不错,即转载分享!在此感谢文章作者雨中发呆。文文可能因浏览器版本不同,破解方法可能略有差异。原文地址:http://blog.sina.com.cn/s/blog_0cfdf27c0102e4nk.html。1、将Internet的安全级别设置为“高”①启动IE→点击菜单“工具”
2013-10-19 13:31:15 2300
转载 Hadoop版本选择探讨
由于Hadoop版本混乱多变,因此,Hadoop的版本选择问题一直令很多初级用户苦恼。本文总结了Apache Hadoop和Cloudera Hadoop的版本衍化过程,并给出了选择Hadoop版本的一些建议。1. Apache Hadoop1.1 Apache版本衍化截至目前(2012年12月23日),Apache Hadoop版本分为两代,我们将第一代Hadoop称为Hadoop
2013-10-19 10:34:21 1507
原创 Eclipse 习惯性快捷键之类的解决总结
我的eclipse 3.7,Ubuntu11.04 32bit 系统自动安装。发觉自动补全功能(alt + /)失效。解决的办法:1、(eclipse)window --> preferences --> General --> keys或者直接在preferences中输入keys,把“word completion”所对应的快捷解(alt + /)去掉(选择需要改变的快捷键行,在bin
2013-10-19 10:17:41 785
转载 hadoop配置、运行错误总结
新手搞hadoop最头疼各种各样的问题了,我把自己遇到的问题以及解决办法大致整理一下先,希望对你们有所帮助。一、hadoop集群在namenode格式化(bin/hadoop namenode -format)后重启集群会出现如下Incompatible namespaceIDS in ... :namenode namespaceID = ... ,datanode namespac
2013-10-16 15:16:35 816
转载 Hive两种模式安装
Hive两种模式安装 数据仓库工具,可以把Hadoop下的原始结构化数据变成Hive中的表。 支持一种与SQL几乎完全相同的语言HiveQL,除了不支持更新、索引和事务。 可以看成是从SQL到Map-Reduce的映射器。 提供shell、JDBC/ODBC、thrift、Web等接口。 一、内嵌模式安装 这样安装的元数据保持在内嵌的
2013-10-15 16:48:24 1000
原创 hadoop 运行期间偶发的各种问题积累(简单问题不展示)
HTTP ERROR: 404/jobtracker.jspRequestURI=/jobtracker.jspPowered by Jetty://端口已打开,且没被其它程序占用;jps查看各服务正常运行,且集群运行也没问题,只是不能查看;./hadoop dfsadmin -report 查看集群节点也没问题;解决办法:buid本地库存后
2013-10-14 16:07:14 963
转载 Mahout安装与配置
Mahout是Hadoop的一种高级应用。运行Mahout需要提前安装好Hadoop。Hadoop的安装网上很多,并不复杂,这里不再讲述,接下来阐述怎么安装Mahout。1:下载二进制解压安装。到http://labs.renren.com/apache-mirror/mahout/0.7下载,我选择下载二进制包,直接解压及可。hadoop@ubuntu:~$ tar -zxvf
2013-10-13 23:49:08 1806
转载 mahout之聚类算法——KMeans分析
一,K-Means聚类算法原理 k-means 算法接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。 K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K
2013-10-13 19:02:01 1427
FLV 视频格式分析工具
2020-11-09
Terrain Assets.unitypackage(Unity3d官方资源包)
2017-08-31
Mahout 学习
2013-10-11
mmseg4j-all-1.8.5-with-dic
2013-08-12
Android 超实用的开关特效
2012-05-24
看源码工具C++,JAVA,.NET,C 大多数常用语言都行
2011-12-23
json-taglib.jar
2011-07-18
后台读取json串,json文件,包含所有需求的jar包
2011-06-21
抓包下载,sniffer,酷六和搜狐的音视频下载
2011-06-08
最新lucene教程
2010-08-29
Power Designer 破解
2010-06-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人