![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 92
程序少年不秃头
知其然,知其所以然
展开
-
TiDB 基本概念 + 实操
官方文档:https://docs.pingcap.com/zh/tidb/stable/overview新一代数据技术:1. ORDBMS:面向对象数据库技术(PostGreSQL)2. NoSQL:非结构化数据库技术- 键值存储数据库:Redis- 列式储存数据库:HBase- 文档型数据库:MongoDB- 图形数据库:Neo4J3. NewSQL:这类数据库不仅具有NoSQL对海量数据的存储管理能力,还保持传统数据库支持ACID和SQL等特性。如:TiDB、OceanBase、Sp原创 2022-05-27 15:52:09 · 702 阅读 · 0 评论 -
大数据之 Hive 理论概念知识
——Hive 基本概念什么是HiveHive:由 Facebook 开源用于解决海量结构化日志的数据统计(目前交由 Apache 基金会)Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能本质:将 HQL 转换为成 MapReduce 程序Hive 处理的数据存储在 HDFSHive 分析数据底层的默认实现 是 MapReduce执行程序运行在 Yarn 上优缺点优点操作接口采用类 SQL 语法,提供快速开发的能力原创 2022-04-24 15:21:14 · 272 阅读 · 0 评论 -
大数据之 HBase 理论知识
——HBase 简介定义HBase 是一种 分布式、可扩展、支持海量数据存储的 NoSQL 数据库数据模型逻辑上,HBase 的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列。但从底层物理存储结构(K-V)来看,HBase 更像是一个 multi-dimensional-map(多维 map)逻辑结构物理存储结构- 名词解释Name Space:命名空间,类似于关系型数据库的 database 概念,每个命名空间下有多个表。HBase 有两个自带的命名空间,分别是 hbas原创 2022-04-17 11:14:32 · 375 阅读 · 0 评论 -
大数据之 Hadoop 基本概念
——大数据技术生态体系Sqoop:Sqoop 主要用户在 Hadoop、Hive 与传统的数据库(MySQL)间进行数据的传递,可以将一个关系型数据库中的数据导进到 Hadoop 的 HDFS 中,也可以将 HDFS 的数据导进到关系型数据库中Flume :Flume 是一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统,Flume 支持在日志系统中订制各类数据发送方,用于收集数据Kafka:Kafka 是一种高吞吐量的分布式发布订阅消息系统Spark:Spark 是当前最流行的开源原创 2022-03-24 15:27:06 · 7733 阅读 · 3 评论