hadoop
kyrin_云中鹤
linux.ubuntu.org.cn
展开
-
hdfs操作
1、HDFS简介 HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。它所具有的高容错、高可靠性、高可扩展性、高获得性、高吞吐率等特征为海量数据提供了不怕故障的存储,为超大数据集(Large Data Set)的应用处理带来转载 2013-12-30 22:56:33 · 1351 阅读 · 0 评论 -
mapreduce全局变量的问题
最近在写mapreduce时,遇到一个问题,在从原创 2014-09-02 15:05:13 · 1843 阅读 · 0 评论 -
hadoop运行第三方jar
在eclipse中写mapreduce程序, 引用第三方jar文件, 可以利用eclipse hadoop插件直接run on hadoop提交, 很方便. 不过插件版本要和eclipse匹配, 不然总是local执行, 在50070是没有job产生的.如果希望将程序发布成jar文件, 在namenode上通过命令行方式执行, 缺少了eclipse帮忙自动配置jar文件, 会遇到java转载 2014-09-01 13:34:28 · 971 阅读 · 0 评论 -
精华索引:大数据实际应用案例50篇
数据化农产品,大数据世界是商机,还是生活? http://www.36dsj.com/archives/11856数据是全国各地农产品批发市场的价格数据。数据采集自全国各大农产品批发市场,每日更新。包括全国各个省直辖市自治区(澳门、香港、西藏、台湾、海南暂无数据)的180多个批发市场、300多种农产品类别。生物医学大数据:现状与展望 http://www.36dsj.com/archive转载 2014-08-31 23:57:24 · 3451 阅读 · 0 评论 -
hadoop运行报错: java.lang.ClassNotFoundException解决方法
在创建自定义的Mapper时候,编译正确,但上传到集群执行时出现错误:11/12/11 22:53:16 INFO mapred.JobClient: Task Id : attempt_201111301626_0015_m_000000_0, Status : FAILEDjava.lang.RuntimeException: java.lang.ClassNotFoundExcept转载 2014-09-01 13:30:48 · 8700 阅读 · 0 评论 -
负载均衡技术全攻略
负载均衡技术全攻略Internet的规模每一百天就会增长一倍,客户希望获得7天24小时的不间断可用性及较快的系统反应时间,而不愿屡次看到某个站点“Server Too Busy”及频繁的系统故障。 网络的各个核心部分随着业务量的提高、访问量和数据流量的快速增长,其处理能力和计算强度也相应增大,使得单一设备根本无法承担。在此情况下,如果扔掉现有设备去做大量的硬件升级,这样将造成现有资源转载 2013-12-30 23:11:13 · 180 阅读 · 0 评论 -
Hadoop实战实例
Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要有什么并发处理或转载 2013-12-31 22:17:19 · 872 阅读 · 0 评论 -
MapReduce,组合式,迭代式,链式
前面介绍一些怎样用户类制定自己的类,来达到减少中间数据:http://www.cnblogs.com/liqizhou/archive/2012/05/14/2499498.html1.迭代式mapreduce 一些复杂的任务难以用一次mapreduce处理完成,需要多次mapreduce才能完成任务,例如Pagrank,Kmeans算法都需要多次的迭代,关于mapreduce迭代在转载 2014-08-27 09:40:11 · 624 阅读 · 0 评论 -
hadoop中的ssh无密码登录配置
目标:在配置hadoop分布式安装过程中,需要配置ssh的无密码登录。在组建hadoop集群的时候,需要多台实体机进行通信(发送或者读取数据,namenode和datanode之间)就是借助ssh,在通信过程中如果需要操作人员频繁输入密码是不切实际的,所以需要ssh的无密码登录。环境:主机qiuchenl0,namenode,ubuntu12.04 操作系统,用户名qiuc转载 2014-08-25 22:02:26 · 892 阅读 · 0 评论 -
HMaster自动退出源于regionServer宕机
一大早起来关注我的小集群,发现HBase不好使了,弄得毫无头绪——只好重新查看守护进程jps 后 返现传说中的HMaster居然。。。不见了!————查看日志!果然:2012-12-17 22:51:13,317 INFO org.apache.zookeeper.ClientCnxn: Unable to reconnect to ZooKeeper service, session 0转载 2014-08-23 19:10:40 · 1644 阅读 · 0 评论 -
Google_三大论文中文版(Bigtable、 GFS、 Google MapReduce)
Google_三大论文中文版(Bigtable、 GFS、 Google MapReduce)中文版下载地址http://pan.baidu.com/s/1sjtZBSL原文地址链接: http://labs.google.com/papers/gfs.html http://labs.google.com/papers/转载 2014-08-24 09:41:22 · 3689 阅读 · 0 评论 -
hdfs java.io.IOException: Mkdirs failed to create
今天写MapReduce的时候, FileOutputFormat.setOutputPath(job, new Path("hdfs://localhost:9000/center_db"));原创 2014-08-24 01:10:21 · 2776 阅读 · 0 评论 -
hadoop 2.5.2 安装时遇到的异常
在安装hadoop 2.5.2的时候,与到了原创 2014-11-23 13:17:19 · 1491 阅读 · 2 评论