自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 11_sqoop_oracle_hive 数据交换实验

参考:   http://f.dataguru.cn/thread-54454-1-1.htmlhttp://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4/SqoopUserGuide.html   虚拟机环境:   redhat 5 软件版本:   下面是CDH3和SQOOP 1.2.0的下载地址 http://archive....

2013-07-28 01:32:11 78

10-Oracle大数据OLH连接

  参考:   http://www.dataguru.cn/forum.php?mod=viewthread&tid=39857   http://blog.sina.com.cn/s/blog_701a48e7010189rc.html   http://www.chenjunlu.com/2012/12/trying-with-oracle-loader-for-ha...

2013-07-21 13:11:32 190

9-hadoop-0.20 单节点安装

  1)安装JAVA 2)SSH免密码 3)解压hadoop 这些安装与 1.03 一样。 1.03   的安装,请参照: http://pftzzg.iteye.com/blog/1910153       4)设置   a)     [root@centerOsMaster home]# vim /etc/profile        export ...

2013-07-21 11:45:11 81

原创 5-Data/name/secondaryname/node

  简称 Dn   全称  datanode    保存Block   启动DN线程的时候会向NN汇报block信息   通过向NN发送心跳保持与其联系(3秒一次),如果NN 10分钟没有收到DN的心跳,则认为其已经lost,并copy其上的block到其它DN       简称Nn 全称 namenode   NameNode主要功能提供名称查询服务,它是一个je...

2013-07-21 02:03:03 105

原创 8-Hadoop MapReduce数据流

  参考:   http://www.linuxidc.com/Linux/2012-02/54485.htm   Hadoop的核心组件在一起工作时如下图所示: 图4.4高层MapReduce工作流水线         MapReduce的输入一般来自HDFS中的文件,这些文件分布存储在集群内的节点上。运行一个MapReduce程序会在集群的许多节点甚至所有节点上运行...

2013-07-20 21:27:40 86

原创 7-MapReduce入门

    MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算   通俗的说就是将一个大任务分成多个小任务并行完成,然后合并小任务的结果,得到最终结果。 1)打包注意:  一定要选择一个MAIN,不然不会运行。   2)          3)输出目录是HADOOP自己创建的。如果有这个目录,一定要删除。如下: 4)测试命令:   java -...

2013-07-20 20:04:19 102

原创 6-HDFS文件系统

  使用HDFS储存文件优点:   1,  扩展方便,只需要增加datanode就可以立刻获得更大的储存空间和更好的数据访问速度   2,可以提供较高的数据库安全性   3,API接口丰富,方便各种不同的客户端调用       ...

2013-07-20 19:25:22 54

原创 4-secondarynamenode

  Namenode的工作特点   Namenode始终在内存中保存metedata,用于处理“读请求”   到有“写请求”到来时,namenode会首先写editlog到磁盘,成功返回后,才会修改内存,并且向客户端返回   Hadoop会维护一个fsimage文件,也就是namenode中metedata的镜像,但是fsimage不会随时与namenode内存中的metedat...

2013-07-20 18:45:12 77

原创 3-hadoop命令

  1、查看指定目录下内容   hadoop dfs –ls [文件目录]   eg: hadoop dfs –ls /user/   2、打开某个已存在文件   hadoop dfs –cat [file_path]   eg:hadoop dfs -cat /user/data.txt   3、将本地文件存储至hadoop   hadoop fs –put [本...

2013-07-20 18:08:30 200

原创 2-集群安装

  1)准备环境   hostname ip 作用   station1 192.168.80.51 Namenaode jobtracher datanode tasktracher   station2 192.168.80.52 Datanode  jobtrac...

2013-07-19 14:45:31 58

原创 1-hadoop-1.03单节点的安装

 1)确认安装了JDK,没有如下安装   [root@primary ~]# cd /home [root@primary home]# cp jdk-6u31-linux-i586-rpm.bin /usr/local/ [root@primary home]# cd /usr/local/ [root@primary local]# chmod +x jdk-6u31-linux...

2013-07-19 14:20:04 123

原创 linux FTP服务

Fedora 9 装完后发现没有VSFTP服务。于我装了一个。方法如下。1 打开 系统-管理-防火墙-FTP 选上。2 安装VSFTP 用root 登录 在终端 运行yum install vsftpd 。会提示。是否更新。选择。Y。直到出现COMPLETE! 完成提示。3 开始VSFTPD ,输入:service vsftpd start 。如果成功,会提示。4 查看 VSFT

2009-04-02 21:23:00 148

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除