自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Hive对库的操作和对表的操作

分桶是相对分区进行更细粒度的划分(数据取样更高效)。分桶将整个数据内容按照某列属性值的hash值进行区分,如要安装name属性分为3个桶,就是对name属性值的hash 值对3取摸,按照取模结果对数据分桶。如取模结果为0的数据记录存放到一个文件,取模为1的数据存放到一个文件,取模为2的数据存放到一个文件。

2022-10-21 15:39:15 455 2

原创 Hive安装与配置常见问题解决

在之前的文章中介绍了Hadoop集群,本文安装的Hive是基于Hadoop的一个数据仓库工具,并底层依赖与HDFS储存数据,本文将介绍如何安装及其配置。

2022-10-14 16:25:10 1084

原创 MapReduce课程学习——好友推荐功能实现

MapReduce学习中的好友推荐功能的实现,在hadoop集群中实现

2022-09-30 19:06:36 1355

原创 如何搭建可正常使用的centOS7系统虚拟机节点

本文详细叙述了centOS7系统虚拟机节点的搭建以及搭建hdfs完全分布式集群准备工作学习linux,首要当然是弄一个linux系统,大多数电脑都是windows系统,而双系统装linux存在一定的风险,个人觉得,在虚拟机上安装linux环境就够了。

2022-09-16 10:50:58 723

原创 一个大数据学生的HDFS完全分布式集群搭建流程与问题

HDFS作为Hadoop的核心组件,其搭建是Hadoop集群能够成功运行的基础,本文就描述了我在搭建HDFS集群时的流程与遇到的问题。以上就是HDFS完全分布式集群搭建的大概流程,有许多问题没有遇到,可能问题写的不够详细,如果有文章和流程中有任何的问题以及心得欢迎评论交流。

2022-09-15 18:54:49 738

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除