自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Airflow安装配置

Airflow的安装与配置本文档记录的是基于Linux Centos系统安装的Airflow。机器:两台服务器(hadoop001,hadoop003)作用:hadoop001 : 安装mysqlhadoop003 : 安装airflowhadoop001事先安装mysql并完成相应的配置在hadoop003中:1 安装 Python31.1 下载安装包wget https://www.python.org/ftp/python/3.6.5/Python-3.6.5.tgz【注】

2021-11-18 13:03:22 1588

原创 Flink中的状态编程(简单案例)

前言前几天学习了一下Flink的状态编程,于是自己想了个需求实现一下来加深对状态编程的理解。需求是这样的:给出一个配置文件,用户在配置文件中定义库名,表名,以及 key列 和 value列等等,通过Flink从kafka中读取这样的数据,继而写入到Doris,在Doris中自动创建库创建表(该表根据配置文件构建,字段及字段类型与数据保持一致,是否分区表由配置文件决定)状态编程什么是有状态编程通俗的说就是当发生一个或者多个事件时,将这些事件信息保存起来的操作,这些操作就是有状态编程。什么情况下需要

2021-09-18 12:15:41 678

原创 Doris(一)--从创建一张表开始

一、创建一张表的艰辛路程在 Doris 中,数据以表(Table)的形式进行逻辑上的描述。创建一张合格的表,主要考虑以下几个方面:字段索引引擎模型分区分桶属性1、Doris中的引擎olapmysqlbrokerHive2、Doris中的三大模型:AggregateUniqDuplicate3、Doris中分区类型RangeList4、建表示例4.1 字段Doris中的数据类型包括:bigintbigmapbooleanch

2021-09-07 16:30:03 7652

原创 Flink流式读取Csv文件&&Doris Routine

文章内容大数据环境之下,各种数据来源参差不齐,本次数据来源于 kochava,kochava 译为 快出海,是全球领先的移动广告归因分析与优化及全球最大的DMP,有兴趣的伙伴可以了解一下这款产品 https://www.kchuhai.com/company/view-60.html,本次的任务就是从该产品中获取数据来源并通过 flink 写入到 Kafka ,最后写入到 Doris中。下面是简单的 数据采集demo内容数据采集(demo)1,通过 https://query.api.kochava.

2021-08-18 13:01:04 1782 1

原创 Flink自定义Source读取OSS系统中文件

自定义Source读取OSS系统中文件一、POM依赖引入<properties> <flink.version>1.9.1</flink.version> <aliyun.oss.version>2.8.3</aliyun.oss.version></properties> <dependencies> <dependency> <groupId>com.a

2021-02-09 18:29:47 1162 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除