呼吸困难的鱼
码龄4年
关注
提问 私信
  • 博客:14,617
    14,617
    总访问量
  • 5
    原创
  • 2,286,652
    排名
  • 7
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2020-10-15
博客简介:

呼吸困难的鱼的博客

查看详细资料
个人成就
  • 获得10次点赞
  • 内容获得2次评论
  • 获得23次收藏
  • 代码片获得180次分享
创作历程
  • 5篇
    2021年
成就勋章
TA的专栏
  • 大数据
    4篇
  • Flink
    3篇
兴趣领域 设置
  • Python
    conda
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Airflow安装配置

Airflow的安装与配置本文档记录的是基于Linux Centos系统安装的Airflow。机器:两台服务器(hadoop001,hadoop003)作用:hadoop001 : 安装mysqlhadoop003 : 安装airflowhadoop001事先安装mysql并完成相应的配置在hadoop003中:1 安装 Python31.1 下载安装包wget https://www.python.org/ftp/python/3.6.5/Python-3.6.5.tgz【注】
原创
发布博客 2021.11.18 ·
1638 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Flink中的状态编程(简单案例)

前言前几天学习了一下Flink的状态编程,于是自己想了个需求实现一下来加深对状态编程的理解。需求是这样的:给出一个配置文件,用户在配置文件中定义库名,表名,以及 key列 和 value列等等,通过Flink从kafka中读取这样的数据,继而写入到Doris,在Doris中自动创建库创建表(该表根据配置文件构建,字段及字段类型与数据保持一致,是否分区表由配置文件决定)状态编程什么是有状态编程通俗的说就是当发生一个或者多个事件时,将这些事件信息保存起来的操作,这些操作就是有状态编程。什么情况下需要
原创
发布博客 2021.09.18 ·
764 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

Doris(一)--从创建一张表开始

一、创建一张表的艰辛路程在 Doris 中,数据以表(Table)的形式进行逻辑上的描述。创建一张合格的表,主要考虑以下几个方面:字段索引引擎模型分区分桶属性1、Doris中的引擎olapmysqlbrokerHive2、Doris中的三大模型:AggregateUniqDuplicate3、Doris中分区类型RangeList4、建表示例4.1 字段Doris中的数据类型包括:bigintbigmapbooleanch
原创
发布博客 2021.09.07 ·
8989 阅读 ·
6 点赞 ·
0 评论 ·
15 收藏

Flink流式读取Csv文件&&Doris Routine

文章内容大数据环境之下,各种数据来源参差不齐,本次数据来源于 kochava,kochava 译为 快出海,是全球领先的移动广告归因分析与优化及全球最大的DMP,有兴趣的伙伴可以了解一下这款产品 https://www.kchuhai.com/company/view-60.html,本次的任务就是从该产品中获取数据来源并通过 flink 写入到 Kafka ,最后写入到 Doris中。下面是简单的 数据采集demo内容数据采集(demo)1,通过 https://query.api.kochava.
原创
发布博客 2021.08.18 ·
1932 阅读 ·
0 点赞 ·
1 评论 ·
3 收藏

Flink自定义Source读取OSS系统中文件

自定义Source读取OSS系统中文件一、POM依赖引入<properties> <flink.version>1.9.1</flink.version> <aliyun.oss.version>2.8.3</aliyun.oss.version></properties> <dependencies> <dependency> <groupId>com.a
原创
发布博客 2021.02.09 ·
1295 阅读 ·
1 点赞 ·
1 评论 ·
2 收藏