- 博客(3)
- 问答 (1)
- 收藏
- 关注
原创 2021-06-21
HIVE概念1) 数据仓库的基本概念:数据库: 存储数据的仓库 一般都是面向于业务系统 主要用于对接业务系统 用于捕获数据 一般要求交互式极强 一般存储业务数据 都要经常进行数据CURD数据仓库: 存储数据的仓库 一般面向于主题(面向于分析) 主要是用于数据分析 一般对交互式没有太大要求 一般是用于存储过去以及既定发生过数据, 一般进行数据的查询数据仓库主要目的, 是对过去的数据进行分析, 从而对未来发展提供决策支持2) 数据仓库的特征:1.主题性 : 面向于分析的主题, 分析的需要是
2021-06-21 15:56:03 102 1
原创 Flink初探
Flink背景介绍Flink 诞生于欧洲的一个大数据研究项目 StratoSphere。该项目是柏林工业大学的一个研究性项目。早期, Flink 是做 Batch 计算的,但是在 2014 年, StratoSphere 里面的核心成员孵化出 Flink,同年将 Flink 捐赠 Apache,并在后来成为 Apache 的顶级大数据项目,同时 Flink 计算的主流方向被定位为 Streaming, 即用流式计算来做所有大数据的计算,这就是 Flink 技术诞生的背景。2014 年 Flink 作为主
2021-01-17 23:31:16 155
原创 kafka基础知识
kafuka基础知识什么是kafka?Kafka是分布式发布-订阅消息系统,它最初是由LinkedIn公司开发的,之后成为Apache项目的一部分,Kafka是一个分布式,可划分的, 冗余备份的持久性的日志服务,它主要用于处理流式数据。kafka的设计初衷: 1.能够应对海量实时消息数据–高吞吐,低延时 2.需要有分布式的系统特征:高可用,水平扩展kafka的核心概念,名词解释1.Broker:代理,就是kafka的一台节点2.Producer:生产者,向kafka推送消息的角色
2020-12-25 23:55:23 1769 3
空空如也
查询结果如果上一个值等于前一个值就不要这个值?
2021-04-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人