大数据徐葳
码龄12年
关注
提问 私信
  • 博客:650,556
    社区:4,383
    学院:600
    655,539
    总访问量
  • 39
    原创
  • 1,420,155
    排名
  • 385
    粉丝
  • 5
    铁粉

个人简介:大数据技术博客

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河南省
  • 加入CSDN时间: 2012-09-23
博客简介:

大数据技术博客

博客描述:
主要关注大数据周边技术 hadoop spark storm flink等...
查看详细资料
个人成就
  • 获得127次点赞
  • 内容获得170次评论
  • 获得517次收藏
  • 代码片获得710次分享
创作历程
  • 6篇
    2023年
  • 1篇
    2022年
  • 23篇
    2018年
  • 4篇
    2017年
  • 1篇
    2016年
  • 4篇
    2015年
成就勋章
TA的专栏
  • paimon
    6篇
  • 大数据
    1篇
  • storm
    1篇
  • java
    1篇
  • redis
    2篇
  • hbase
  • docker
    2篇
  • es
    3篇
  • flink
    23篇
  • 40小时掌握java语言
兴趣领域 设置
  • 大数据
    hadoophivestormsparketl
TA的社区
  • 徐葳的课程社区_NO_1
    1 成员 86 内容
    创建者
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

6 Hive引擎集成Apache Paimon

想要在Hive中操作Paimon,首先需要在Hive中配置Paimon的依赖,此时我们需要用到一个jar包:paimon-hive-connector。
原创
发布博客 2023.11.10 ·
2417 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

5 Paimon数据湖之表数据查询详解

主要涉及Paimon中系统表的查询、批量读取、流式读取,以及时间旅行特性的使用。
原创
发布博客 2023.11.10 ·
2708 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

4 Paimon数据湖之Hive Catalog的使用

Paimon提供了两种类型的Catalog:Filesystem Catalog和Hive Catalog。
原创
发布博客 2023.11.10 ·
2234 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

3 Paimon数据湖中的表类型详解

Paimon中支持多种表类型,从全局维度来看,Paimon中的表类型可以大致划分为4种:内部表、外部表、分区表和临时表。从存储维度来看,Paimon中的表可以分为两种:Primary Key表,也可以称之为主键表。Append Only表,也可以称之为仅追加表。
原创
发布博客 2023.11.08 ·
5948 阅读 ·
5 点赞 ·
0 评论 ·
7 收藏

2 快速上手使用Paimon数据湖

想要使用Paimon是非常简单的,不需要复杂的安装部署,只需要使用一个jar包即可对它进行操作。目前Paimon主要提供的是SQL层面的API,所以我们在使用Flink操作Paimon的时候需要用到Flink SQL。
原创
发布博客 2023.11.08 ·
2720 阅读 ·
0 点赞 ·
0 评论 ·
11 收藏

1 快速了解Paimon数据湖核心原理及架构

Apache Paimon的前身属于Flink的子项目:Flink Table Store。目前业内主流的数据湖存储项目都是面向批处理场景设计的,在数据更新处理时效上无法满足流式数据湖的需求,因此Flink社区在2022年的时候内部孵化了 Flink Table Store (简称 FTS )子项目,一个真正面向流以及实时的数据湖存储项目。
原创
发布博客 2023.11.08 ·
2371 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

流式数据湖Paimon课程完整课件内容

发布资源 2023.11.08 ·
pdf

数据湖 paimon flink 0.5版本 jar 包

发布资源 2023.11.08 ·
jar

一文看懂大数据生态圈完整知识体系【大数据技术及架构图解实战派】

一文看懂大数据生态圈完整知识体系,包含Hadoop、Spark、Flink、Kafka、Elasticsearch、数据仓库等内容。
原创
发布博客 2022.08.03 ·
8382 阅读 ·
12 点赞 ·
1 评论 ·
126 收藏

徐葳《40小时掌握java语言之09网络编程+正则表达式》内部教材

发布资源 2019.03.26 ·
pdf

徐葳《40小时掌握java语言之08IO流》内部教材

发布资源 2019.03.26 ·
pdf

徐葳《40小时掌握java语言之07集合》内部教材

发布资源 2019.03.26 ·
pdf

徐葳《40小时掌握java语言之06String类》内部教材

发布资源 2019.03.26 ·
pdf

徐葳《40小时掌握java语言之05多线程》内部教材

发布资源 2019.03.26 ·
pdf

徐葳《40小时掌握java语言之04继承》内部教材

发布资源 2019.03.26 ·
pdf

徐葳《40小时掌握java语言之03面向对象》内部教材

发布资源 2019.03.26 ·
pdf

徐葳《40小时掌握java语言之02基础语法》内部教材

发布资源 2019.03.26 ·
pdf

徐葳《40小时掌握java语言之01编程入门》内部教材

发布资源 2019.03.26 ·
pdf

Flink Table API 和 SQL之概述

Flink针对标准的流处理和批处理提供了两种相关的API,Table API和sql。TableAPI允许用户以一种很直观的方式进行select 、filter和join操作。Flink SQL支持基于Apache Calcite实现的标准SQL。针对批处理和流处理可以提供相同的处理语义和结果。Flink Table API、SQL接口和Flink的DataStream API、DataSe...
原创
发布博客 2018.11.23 ·
3144 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Flink EventTime和Watermarks案例分析

目录解释:1:实现watermark相关代码1.1:程序说明1.2:代码如下1.3:程序详解2:通过数据跟踪watermark的时间3:watermark+window处理乱序数据4:late element(延迟数据)的处理4.1:丢弃(默认)4.2:allowedLateness 指定允许数据延迟的时间4.3:sideOutputLateData 收...
原创
发布博客 2018.10.22 ·
11309 阅读 ·
14 点赞 ·
10 评论 ·
36 收藏
加载更多