- 博客(9)
- 收藏
- 关注
原创 实验三 编程调试WordCount程序
一、实验目的: MapReduce架包、调试WordCount程序二、实验过程与方法:1、在HDFS的基础上运行以下四个程序2、对HDFSFilefExist.java程序进行打包。①、先将HDFSFilefExist.java程序从hdfs.files包中分离出来,它会自动形成另一个包default.package。②、对分离出来的default.package包再次进行打包(1)...
2019-05-21 13:29:03 395
原创 实验二 搭建HDFS、安装配置JDK+Eclips+Maven
一、实验目的:搭建HDFS、安装配置JDK+Eclips+Maven二、实验过程与方法:1、下载 jdk-8u201-windows-x64.exe,并进行安装配置2、下载安装Eclipse3、下载apache-maven-3.6.0-bin.zip,并进行解压。4、配置Maven的环境变量,Path添加Maven的\bin的安装路径,cmd命令行运行mvn -v,查看是否成功安装配置...
2019-05-21 12:53:29 291
原创 实验一 Hadoop安装与配置
Hadoop安装与配置一、实验目的:Hadoop安装与配置二、实验的步骤与方法1、下载安装VMware2、安装CentOs系统①、双击打开VMware,建立新的虚拟机②、选择典型按安装步骤一步步进行③、设置自己的虚拟机名称,选择安装位置④、设备选择“新CD/DVD”,连接选择使用ISO映像文件,点击浏览找到自己的ISO映像文件⑤、开启此虚拟机3、安装CRT,并建立连接4、...
2019-05-21 12:14:06 5425
原创 后裔爬虫
1、后裔采集器基本界面,主要分为三大块:智能模式、流程图模式、数据发布2、数据采集首先下载安装后裔采集器→在首页直接输入要采集的数据正确网址→单击智能采集等待采集→单击开始采集等待结果...
2019-03-18 18:39:21 2650
原创 用于大数据分析的六大工具
用于大数据分析的六大工具:①、HadoopHadoop是一个能够对大量数据进行分布式处理的软件框架。但是Hadoop是以一种可靠、高效、可伸缩的方式进行处理的。②、HPCC高性能计算与通信)的缩写③、StormStorm是自由的开源软件,一个分布式的、容错的实时计算系统。Storm可以非常可靠的处理庞大的数据流,用于处理 Hadoop的批量数据。④、Apache...
2019-03-04 20:22:11 935
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人