自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Hadoop

Hadoop〖一〗Hadoop3.2.1版本本地安装伪集群实现词频统计案例 一. 安装Hadoop在虚拟机上 1.1 准备一台虚拟机 1.2 安装JDK 1.3 安装Hadoop 二. 接下来进行配置伪分布式(上面的Hadoop只是单机模式) 2.1 创建文件夹 2.2 修改hadoop配置文件 2.3 启动Hadoop 2.4 访问UI界面 三. 实现WordCount案例(词频统计) 3.1 词频统计实现 3.2 将测试文本拖进hdfs 3.3 执行案例jar包 制作不易,转载请标注~ 一. 安装Had

2021-10-10 13:53:37 198

原创 什么是大数据

什么是大数据 说起大数据,估计大家都觉得只听过概念,但是具体是什么东西,怎么定义,没有一个标准的东西,因为在我们的印象中好像很多公司都叫大数据公司,业务形态则有几百种,感觉不是很好理解,所以我建议还是从字面上来理解大数据,在维克托迈尔-舍恩伯格及肯尼斯库克耶编写的《大数据时代》提到了大数据的4个特征: 一个是数量大 一个是价值大 一个是速度快 一个是多样性 第一个是数量比较大,只有数据体量达到了PB级别以上,才能被称为大数据。1PB等于1024TB,1TB等于1024G,那么1PB等于1024*1024

2021-10-10 11:28:52 403

原创 什么是大数据

什么是大数据 说起大数据,估计大家都觉得只听过概念,但是具体是什么东西,怎么定义,没有一个标准的东西,因为在我们的印象中好像很多公司都叫大数据公司,业务形态则有几百种,感觉不是很好理解,所以我建议还是从字面上来理解大数据,在维克托迈尔-舍恩伯格及肯尼斯库克耶编写的《大数据时代》提到了大数据的4个特征: 一个是数量大 一个是价值大 一个是速度快 一个是多样性 第一个是数量比较大,只有数据体量达到了PB级别以上,才能被称为大数据。1PB等于1024TB,1TB等于1024G,那么1PB等于1024*1024

2021-10-10 11:27:38 427

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除