自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 csdn_export_md

简单的词频统计一.实验准备1.所需要的软件:J ava语言编译器IDEA2.hadoop安装完成,并且安装完成mapreduce和hdfs这两个组件二.实现词频统计1.建立一个文本文档wlc.txt2.打开eclipse,写入Java代码package hdfs;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import o

2020-12-30 17:23:41 54

原创 csdn_export_md

NoSQL数据库HBase一.HBase 原理什么是HBaseHBase 是一个高可靠、高性能、面向列、可伸缩的分布式存储系统,利用Hbase技术可在廉价PC Server上搭建 大规模结构化存储集群。HBase 是Google Bigtable 的开源实现,与Google Bigtable 利用GFS作为其文件存储系统类似, HBase 利用Hadoop HDFS 作为其文件存储系统;Google 运行MapReduce 来处理Bigtable中的海量数据, HBase 同样利用Hadoop Ma

2020-11-23 15:35:01 70

原创 2020-11-02

MapReduce1.MapReduce原理本节将对的MapReduce起源、MapReduce主要功能、MapReduce的处理流程等方面进行分析。(1)MapReduce是hadoop的核心组件之一,hadoop要分布式包括两部分,一是分布式文件系统hdfs,一部是分布式计算框,就是mapreduce,缺一不可,也就是说,可以通过mapreduce很容易在hadoop平台上进行分布式的计算编程。(2)Mapreduce是一种编程模型,是一种编程方法,抽象理论。2.MapReduce的概述(1.)

2020-11-02 15:17:10 149 1

原创 2020-10-26

HDFS是什么?易于扩展的分布式文件系统运行在大量普通廉价机器上提供容错机制为大量用户提供性能不错的存取服务HDFS简介HDFS:它是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,适合那些有着超大数据集(large data set)的应用程序。HDFS的假设前提和设计目标1.硬件错误硬件组件错误是常态,而非异常情况。HDFS可能由成百上千的服务器组成,每一个服务器都是廉价通用的普通硬件,任何一个组件都有可能一直失效,因此错误检测和快速、自动恢复是HDFS的

2020-10-26 17:36:25 1282 1

原创 无意识

实训作业一, 自我介绍 大家好,来自甘肃省景泰县,很高兴能和大家成为同学,共度美好的大学生活。本人爱笑,爱简单,爱热闹,爱听音乐,也爱交朋友,爱自由自在,爱hold不住的兴奋,爱安安静静的自得其乐,这就是我。 进入大学意味着无限的机会,一个征服新的领域的机会。我想在大学充实自己的生活,培养自己的能力,不断拔高自己。舞台这么大,我会很很努力地去拼搏,去奋斗。博一下,才不悔我大学的一路走来。加油!二,对大数据的认识随着通信技术的不断发展,大数据应运而生,大数据的产生,利于我们从海量,复杂的数据中

2020-07-18 15:29:51 206

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除