草莓味的甜
码龄5年
关注
提问 私信
  • 博客:3,816
    3,816
    总访问量
  • 10
    原创
  • 2,096,167
    排名
  • 2
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2020-06-21
博客简介:

qq_48847763的博客

查看详细资料
个人成就
  • 获得15次点赞
  • 内容获得0次评论
  • 获得5次收藏
创作历程
  • 10篇
    2020年
成就勋章
TA的专栏
  • 大数据 之 Zookeeper
    1篇
  • 大数据 --- Hive
    3篇
  • 大数据Hadoop --- HDFS
    2篇
  • 大数据---Hbase
    2篇
  • JAVA基础
    1篇
兴趣领域 设置
  • 大数据
    spark
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Zookeeper--入门详解

一 . Zookeeper 入门What is Zookeeper ? ZooKeeper主要服务于分布式系统,可以用ZooKeeper来做:统一配置管理、统一命名服务、分布式锁、集群管理 使用分布式系统就无法避免对节点管理的问题(需要实时感知节点的状态、对节点进行统一管理等等),而由于这些问题处理起来可能相对麻烦和提高了系统的复杂性,ZooKeeper作为一个能够通用解决这些问题的中间件就应运而生了 二 . Zookeeper 用途广泛 那么其原因是什么呢 ?..
原创
发布博客 2020.09.07 ·
228 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hive笔记 ---之hive 分区表 分桶表 详解

--- 本章节目录分区表 (静态分区 动态分区)分桶表抽样查询分区表 数据分区的概念以及存在很久了,通常使用分区来水平分散压力,将数据从物理上移到和使用最频繁的用户更近的地方,以及实现其目的hive中处理的数据在HDFS中 , select * from tb_name where dt=2020-09-03;查询表中的数据是加载HDFS中对应表文件夹下的数据 ,文件夹下的数据很多,将数据全部加载以后再筛选过滤出数据, 显然效率低,Hive中的分区表起始就是根据...
原创
发布博客 2020.09.04 ·
512 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hbase --- 原理加强 第 <1> 篇

--- 数据存储rowkey的作用:在内部数据是按照rowkey排序的(字典顺序) 在rowkey上是有数据索引的 , 查询的时候按照rowkey查询数据最快1> Table中的所有行都按照row key的字典序排列HBase是三维有序存储的,是指rowkey(行键),column key(column family和qualifier)和TimeStamp(时间戳)这个三个维度是依照ASCII码表排序的 (比如A排在a前面)先rowkey升序排序, rowkey相同则co
原创
发布博客 2020.09.03 ·
317 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Hive -- DDL 数据库 表 基础操作

Hive 数据类型 对于Hive的String类型相当于数据库的varchar类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它可以存储2GB的字符数--- DDL基础操作 ------ 显示系统中所有的数据库show databases ;+----------------+| database_name |+----------------+| default || demo |+--...
原创
发布博客 2020.09.01 ·
293 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

Hive是什么 简介 安装部署 连接详解

什么是Hive解决海量结构化日志的数据统计(海量的结构化数据的运算分析)它是一个数仓工具,不是数据库 通过SQL形式 处理,分析,统计,运算HDFS上的海量结构化数据--->报表本质:Hive(HQL)底层转换成MR程序,提交到Yarn分布式运行Hive处理数据存储在HDFS上 Hive分析数据底层的实现是MapReduce/ spark(分布式运算框架) 执行程序运行在Yarn上优点与缺点 简述--- 优点操作接口采用类SQL语法,提...
原创
发布博客 2020.08.31 ·
517 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

Hbase是什么

--- Hbase 简述分布式,面向列的开源数据库高可靠性,高性能,面向列,可伸缩的分布式数据系统高可靠性:安全性 对外服务可靠高性能:处理数据的速度 效率 集群所有机器的运算资源处理数据面向列:在hbase底层存储的所有的数据都是以key/value组成的字节数据可伸缩性: 存储能力 运算能力 两者来看通过添加节点来扩展存储容量和添加运算资源用于存储海量的结构化或半结构 非结构化 的数据即 结构化 非结构 数据系统将数据存储在不同的机器上 利用不同机...
原创
发布博客 2020.08.30 ·
900 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

HDFS---客户端入门 API

封装工具类public class DoitUtils { /** * 返回操作hdfs://linux01:8020/ 文件系统的客户端对象 * @return * @throws Exception */ public static FileSystem getFs() throws Exception { return FileSystem.newInstance(new URI("hdfs://linux01:802..
原创
发布博客 2020.08.29 ·
115 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

HDFS --- 基础操作应用

--- HDFS客户端操作 --- HDFS提供了两种客户端操作SHELL命令和JAVA接口都可以和HDFS系统交互!用户可以上传,下载,读取,追加数据内容,删除,移动......namenode1)用于记录文件存储的元数据 对象(NameNode将这些数据的元数据信息记录在内存中,并且将这些元数据信息定期的序列化到本地磁盘上), 记录用户操作的行为日志 .记录用户存储的文件的大小、切分的块数、每一块的副本数和存储在DataNode上的位置2)接收客户端的请求,给datanode'分配...
原创
发布博客 2020.08.29 ·
490 阅读 ·
3 点赞 ·
0 评论 ·
3 收藏

Linux系统目录---基础命令

--- Linux 系统目录结构 ---* /bin:存放系统命令的目录,所有用户都可以执行。* /sbin : 保存和系统环境设置相关的命令,只有超级用户可以使用这些命令,有些命令可以允许普通用户查看。* /usr/bin:存放系统命令的目录,所有用户可以执行。这些命令和系统启动无关,单用户模式下不能执行* /usr/sbin:存放根文件系统不必要的系统管理命令,超级用户可执行* /root: 存放root用户的相关文件,root用户的家目录。宿主目录 超级用户* /hom..
原创
发布博客 2020.08.29 ·
351 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

Day02 笔记摘要.xmind

发布资源 2020.06.21 ·
xmind

JAVA基础

原创
发布博客 2020.06.21 ·
87 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏