HDFS的Java接口
需要使用linux的图形界面,需要登录到eclipse
一般情况下,我们写大量数据的时候用的还是Java接口,我们使用的shell只进行一些简单的操作(删除,查看上传是否成功)
因此,我们采用Java接口的方式来操作HDFS。【我们在Linux下开发,因此一定要使用图形界面】
因此,学hadoop,就变成了要掌握Java基础,因此,在这里开一个番外,简要地了解一下Java的知识,语句,和执行Java的IDE
首先,安装一个eclipse。eclipse是一款开源的,软件集成环境【IDE】 有Windows版本和Linux版本两种
1、打开eclipse,点击文件-新建-Java 项目,输入project name:hadoop0106,点击finish
2、管理一些依赖,导java包,文件-新建-文件夹Folser,
输入或选择父文件夹:hadoop0106 文件夹名:lib,然后把它依赖的java包放在这里
F:\vmware\hadoop\hadoop-2.2.0\share\hadoop\common里的3个文件+
F:\vmware\hadoop\hadoop-2.2.0\share\hadoop\common\lib里的全部+
F:\vmware\hadoop\hadoop-2.2.0\share\hadoop\hdfs里的3个,都复制到lib里
然后全选,右键构建路径Build Path-添加到构建路径Add to Build Path
3、接着写java程序
新建-类class,指定一个 包名:cn.itcast.hadoop.hdfs 名称:HDFSDemo,选择public static void main,点击完成
用户无需了解哪些底层信息,而是它给我一个工具类,只要我使用这些工具类,就能把这些细节隐藏起来。用户可以非常方便的上传下载。
4、开始写代码
【一定要保证你当前JDK的版本和Hadoop集群是一样的】
HDFS里有一个工具类叫:FileSystem 来自org.apache.包
在讲课的人里面,他一输入FileSystem,就能出来这个包,还能自动import这个包,我一出来就是报错
原因:他用了快捷键Alt+/这个键 之后只要双击那个org.apache.hadoop.fs那个,就可以自动import那个包了。
上次就卡在这里了,现在,继续开工!
关联源码,双击FileSystem,鼠标放在上面出现一些东西,放到最下面,点击最下面的“打开声明”,可以出现关联源码界面,选择连接源代码