自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 logstash实现相同数据输出到不同的kafka主题

logstash版本:7.13.3配置一input { beats { port => 5046 ssl => false }}output { if [fields][log_type] == "login" { kafka { bootstrap_servers => "0.0.0.0:9092" topic_id => "login"..

2021-07-17 01:33:27 581

原创 mysql binlog异常处理方法

1、停止mysql服务2、删除Data目录下所有的mysql-bin开头的文件3、重启mysql服务

2021-07-11 10:01:29 302

原创 canal 出现异常Cause: org.h2.jdbc.JdbcSQLException: Table “META_HISTORY“ not found

canal版本:1.1.5### The error may exist in spring/tsdb/sql-map/sqlmap_history.xml### The error may involve com.alibaba.otter.canal.parse.inbound.mysql.tsdb.dao.MetaHistoryMapper.findByTimestamp### The error occurred while executing a query### SQL: sel.

2021-07-11 09:35:17 2204

原创 flinksql使用hive内置函数

flink版本:1.13.1TableEnvironment.loadModule("hive",new HiveModule("2.3.5"));

2021-07-10 09:30:02 408

原创 flink api校验建表语句的正确性

import org.apache.flink.table.api.EnvironmentSettings;import org.apache.flink.table.api.SqlDialect;import org.apache.flink.table.api.TableEnvironment;import org.apache.flink.table.api.internal.TableEnvironmentImpl;import org.apache.flink.table.delegat.

2021-07-06 21:00:39 381 2

原创 修改flinksql已经定义表的表结构

flink版本:1.13.1方案一:使用sql-clientFlink SQL> set table.sql-dialect=default;Flink SQL>alter table `hive`.`default`.ods_dsp_kafka set('flink.connector.startup-mode'='timestamp');如果要新增字段,必须同时添加name和data-type,不然会导致表损坏,这个时候要用hive cli修复。alter t.

2021-07-06 20:44:50 1566 3

原创 alink:批式训练和保存模型,流式消费和分类文本

背景:需要对kafka里的聊天内容进行实时判断是否违规还是正常,打上标签后推送到下游系统。版本: alink1.4.0,flink1.12.1 alink文档:https://www.yuque.com/pinshu/alink_doc https://gitee.com/mirrors/Alink训练数据:train.txt1表示违规,0表示正常label|review1|我是折扣后台 请一起折扣玩...

2021-06-30 21:43:58 543 2

原创 flink基于savepoint点的重启脚本

flink版本:1.12.4#!/bin/bashjob_name=start_log=stop_log=savepointpath=#如果之前已经启动,从start_log里面拿到jobid#根据job_name从yarn拿到application id#根据jobid和application id停止任务,注意缺少application id可能停止不了任务#start_log应该可以拿到jobid和application id,要看日志打印全不全#hdfs://emr-c.

2021-06-29 21:50:00 993 1

原创 关于flink kafkaconsumer的偏移量存储位置测试

偏移量存储位置:1、如果设置了状态后端和checkpoint机制,同时有下面设置: FlinkKafkaConsumer.setCommitOffsetsOnCheckpoints(true) (上面代码表示每次checkpoint的时候把组消费偏移量提交到kafka,默认为true) 那么组消费偏移量会记录到 状态后端 和 kafka2、如果设置了状态后端和checkpoint机制,同时有下面设置: FlinkKafkaConsumer.set...

2021-06-26 15:48:53 1867

原创 docker的理解和简单制作

目录1、定义Dockerfile文件​2、构建容器3、查看本地已有容器4、运行容器5、查看正在运行的容器6、停止正在运行的容器7、启动已经关闭的容器8、删除本地已经创建的容器9、 暴露容器内的端口给外部使用10、容器内使用外部的服务1、定义Dockerfile文件 创建任意名字的目录docker-test,进入docker-test目录创建文件Dockerfile,内容如下: FROM java 上面的意思是...

2021-06-23 22:32:55 91 2

原创 关于flink watermark水位线的理解

本文章基于以下两个视频的一点理解:https://www.bilibili.com/video/BV1qy4y1q728?p=51https://www.bilibili.com/video/BV1qy4y1q728?p=52假设以event-time作为时间,延迟2秒,窗口大小是5秒。注意:flink可以同时存在两个窗口的数据在等待计算。理解一:1、时间戳1的数据到来,时间范围在[0,5)内,数据进入桶[0,5)2、时间戳4的数据到来,时间范围在[0,5)内,数据进入桶[0,

2021-06-23 21:34:18 333

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除