HADOOP grep案例

最新推荐文章于 2023-06-01 08:13:09 发布

荒于随_精于思

最新推荐文章于 2023-06-01 08:13:09 发布

阅读量5.7k

点赞数 4

文章标签： hadoop

本文链接：https://blog.csdn.net/qq_42761655/article/details/95741093

版权

1.HADOOP运行模式可分为三种：

  （1）本地模式（默认模式）：
   不需要启用单独进程，直接可以运行，测试和开发时使用。
（2）伪分布式模式：
   等同于完全分布式，只有一个节点。
（3）完全分布式模式：
   多个节点一起运行。

2.官方grep模式运行实例

（1）创建input目录

(2) 将etc目录下所有的xml复制到input目录下

（3）运行hadoop命令

运行命令解释：bin/hadoop hadoop启动命令

jar 以jar包运行方式运行

share/hadoop/mapreduce-examles-2.7.2.jar 这是hadoop官网提供的案例目录

grep 启动grep案例，官方提供的案例非常多，如wordcount模型等

input 输入目录

output 输出目录（千万不要自己创建、hadoop源码中会判断这个文件是否存在、存在的话会报异常）

'dfs[a-z.]+'正则表达式表示已dfs开头所有匹配项，可无限累加

故hadoop grep 模式的作用为：提供一些文本文件, grep可以从中找到想要匹配的文本(可以是正则表达式).

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

荒于随_精于思

关注关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【Hadoop学习】本地模式下的官方grep和wordcount案例

Anneaisun1995的博客

05-15

1317

1.grep案例 1）在hadoop-2.7.2文件下新建一个input文件夹 mkdir input 2)将/etc/hadoop目录下所有的配置文件拷贝到input文件夹下面 cp etc/hadoop/*.xml input/ 3)运行grep命令筛选出符合规则的结果 hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-...

Hadoop学习——Hadoop单机运行Grep实例（包含错误解决方法）

长弓同学的python学习笔记

08-29

5358

上一篇安装了Hadoop单机，所以今天打算先用Hadoop的mapreduce自带的Grep实例实践一下，顺带测试Hadoop是否成功安装。（不是水博客，有在努力填坑）实践开始之前，我们需要了解一下Grep实例，Grep（缩写来自Globally search a Regular Expression and Print）是一种强大的文本搜索工具，它能使用特定模式匹配（包括正则表达式）搜索文本。...

4 条评论您还未登录，请先登录后发表或查看评论

Hadoop本地运行模式（Grep案例和WordCount 案例）

rm -rf/坏习惯

03-28

4897

Hadoop运行模式包括：本地模式、伪分布式模式以及完全分布式模式。这里先介绍本地运行模式运行官方Grep案例提供一些文本文件, grep可以从中找到想要匹配的文本运行官方WordCount 案例这例子是对文件中某些单词进行统计数。

hadoopgrep案例

最新发布

03-13

### Hadoop Grep 示例代码及用法 #### 使用 `grep` 实现 MapReduce 任务 Hadoop 提供了一个名为 `grep` 的示例程序来演示如何使用MapReduce执行简单的文本过滤操作。此工具可以从输入文件中提取匹配特定正则表达式...

大数据之Hadoop（三）-Hadoop运行模式之本地运行模式（实现官方Grep案例和WordCount案例）

jQueryZK的博客

10-04

2132

Hadoop本地运行模式 1、官方Grep案例创建在hadoop-2.7.2文件下面创建一个input文件夹 [zhukun@hadoop101 hadoop-2.7.2]$ mkdir input 将Hadoop的xml配置文件复制到input [zhukun@hadoop101 hadoop-2.7.2]$ cp etc/hadoop/*.xml input 执行share目录下的MapReduce程序 [zhukun@hadoop101 hadoop-2.7.2]$ bin/had

Hadoop运行官方Grep本地案例时显示权限不够图片如下

Gsen2819的博客

12-09

1272

#HHadoop运行官方Grep本地案例时显示权限不够图片如下这是执行bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output ‘dfs[a-z.]+’ 命令后的结果用sudo执行此条命令后相同显示求解答其中/*.xml文件已经拷贝到了input文件目录...

初探大数据之本地运行Hadoop wordcount和grep案例

L120210123的博客

01-13

1288

经过上上一章博客的介绍，大概了解了hadoop框架的作用和技术组成。同时，在上一章中，配置了hadoop和jdk的环境变量。这一章，体验一下hadoop魅力，虽然说是体验hadoop的魅力，其实我知道，我根本连hadoop的门都还没有踏入，但是我相信，任何事都是由简到难，只要我能坚持下去，总会有那么一天的...... 就像当初学习java一样，起初都会从“Hell...

04 - Hadoop本地运行模式之Grep案例、WordCount案例

花&败

05-22

656

在文件中输入如下内容。

hadoop实现grep示例分享

09-04

主要介绍了hadoop实现grep示例,可从文档中提取包含某些字符串的行,需要的朋友可以参考下

Hadoop官方案例Grep解析--本地模式（Hadoop学习 1）

weixin_42369418的博客

08-06

1443

Hadoop官方案例Grep解析和学习这是我第一次写博客，如果有写的不好的地方，希望各位多担待，并且可以指出我的错误所在。 Grep是什么东西呢？ grep （缩写来自Globally search a Regular Expression and Print）是一种强大的文本搜索工具，它能使用特定模式匹配（包括正则表达式）搜索文本。这是我从百度百科上面复制来的，从这上面可以看出来Grep是一...

hadoop官方案例grep和wordCount实践

流年似水的博客

05-29

873

1、GREP grep的作用? 从文件中使用正则，匹配需要查找的字符并输出。案例步骤以下全部内容都在hadoop-3.2.1进行 1、准备工作 $ mkdir input $ cp etc/hadoop/*.xml input/ $ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar grep input output 'dfs[a-z.]+' hadoop-mapreduce-examples-3.2.1.jar

Hadoop 实战实例

欢迎朋友，我是一名十多年开发经验的新手，希望多多指教。

06-01

2185

Hadoop是GoogleMapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样，MapReduce的run-time系统会解决输入数据的分布细节，跨越机器集群的程序执行调度，处理机器的失效，并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要有什么并发处理或者分布式系统的经验，就可以处理超大的分布式系统得资源。

[Hadoop]MapReduce编程---分布式grep的实现

让勤奋成为习惯

12-06

3722

分布式grep的MapReduce实现MapReduce的例子网上有很多，这里给出一个分布式grep的实现。分布式grep的MapReduce实现 grep简介实现目标算法思路代码块grep简介 Linux系统中grep命令是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。grep全称是Global Regular Expression Print，表示全局正

hadoop之grep

sunlylorn的专栏

01-11

4799

hadoop streaming -D stream.non.zero.exit.is.failure=false ... #!/bin/sh isdebug=false STREAMING=/home/work/software/hadoop/contrib/streaming/hadoop-streaming.jar HADOOP=/home/work/software/ha

hadoop grep问题

weixin_34408624的博客

08-31

258

今天应业务方要求，找一个指定URL在HDFS原始日志中的记录条数，为了方便，就直接使用hadoop-examples-*.jar包中的 grep 作业。提交作业 [root@localhostyinjie]>hadoopjar$HADOOP_HOME/hadoop-examples-*.jargrep-Dmapred.job.queu...

Hadoop 类Grep源代码注释

在爬行中进步

07-04

1636

/** * Licensed to the Apache Software Foundation (ASF) under one * or more contributor license agreements. See the NOTICE file * distributed with this work for additional information * regard

HADOOP学习_grep和wordcount的例子

YuuuPeeiiiii的博客

05-02

1345

两个小例子目录操作文件操作追加文件目录操作首先检查一下自己的hdfs是不是有/user路径 http://localhost:50070/explorer.html#/ 没有就新建一个 mac@kkkMac hadoop-2.7.3 % ./bin/hdfs dfs -mkdir -p /user/hadoop 22/05/02 15:43:54 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your plat