大数据
文章平均质量分 54
pingzishinee
这个作者很懒,什么都没留下…
展开
-
hadoop HDFS常用文件操作命令
hadoop HDFS常用文件操作命令最近用到hdfs,要把跑到的数据存到hdfs上。涉及到一些常用的命令。速查手册先简单理解:用法我先理解为,类似于linux命令前面加个hadoop fs -如,hadoop fs -ls ,hadoop fs -mkdir。显示目录下文件 lshadoop fs -ls查看文件内容 cathadoop fs -cat test.txt建目录 mkdirhadoop fs -mkdir log_data拉hdfs上的文件到本地 gethadoo原创 2021-06-17 17:13:37 · 937 阅读 · 0 评论 -
hadoop命令
查看指定目录下内容: hdfs fs -ls创建目录: hdfs fs -mkdir将本地文件存储到hadoop: hdfs fs -put将hadoop上某个文件down到本地已有目录:hadoop fs -get 文件路径 本地路径hget hdfs://机器/路径 本地路径 把hdfs上的数据拉到本地后续补充…...原创 2020-12-02 11:26:54 · 186 阅读 · 1 评论 -
MapReduce大致执行过程
1. 将要执行的MapReduce程序复制到Master和每一台Worker机器中2. Master决定Map程序与Reduce程序分别由哪些Worker机器执行3. 将所有的文件分块,分配到执行Map程序的Worker机器中进行Map4. 将Map后的结果存入Worker机器的本地磁盘5. 执行Reduce程序的Worker机器远端读取每一份Map结果,进行调整排序,同时执行Reduce程原创 2016-06-27 17:42:25 · 509 阅读 · 0 评论 -
非常用心的好上手coding的MapReduce编程模型
文章目录一、前言二、wordcount原理及分析1、如何统计单词数?MapReduce数据处理逻辑MapReduce架构(可略过)三、wordcount codeWordcountMapper.javaWordcountReducer.javaWordcountDriver.java四、梳理一下MR编程规范五、补充一下hadoop mapreduce内置数据类型一、前言可以看这几个视频,挺棒的...原创 2019-12-09 20:39:46 · 243 阅读 · 0 评论 -
如何上传数据到集群的HDFS上
直接甩例子,如下。背景我windows机子上有一个rai_4m1.txt文件。我要将它传到一个hadoop集群上去,放到hdfs上。集群中有一台机器,地址为192.168.0.41。借用工具1、Xftp传文件从一台机器上到另一台机器上。配好会话后可直接给目标机器新建目录,将源机器上的文件拖上去。2、Xshell远程敲命令。如何将这个rai_4m1.txt数据放到集群的HDFS上...原创 2019-12-04 21:51:18 · 8213 阅读 · 0 评论