- 博客(56)
- 收藏
- 关注
原创 Doris规范
3.2 没有办法分区的,数据又较快增长的,没办法按照时间动态分区,可以适当放大一下你的bucket数量,按照你的数据保存周期(180天)数据总量,来估算你的bucket数量应该是多少,建议还是单个bucket大小在1-3G。2.【强烈建议】不要使用Auto Bucket ,按照自己的数据量来进行分区分桶,这样你的导入及查询性能都会得到很好的效果,Auto Bucket 会造成 tablet 数量过多,造成大量小文件的问题。3.1 没有办法分区的,数据又缓慢增长的:单个tablet数据量保持在1-3G;
2024-09-30 11:42:35 956
原创 IDEA远程调试Dinky
最近发现本地和服务器上同样的包但是服务器上的服务报错,特此debug点击RUN---edit configuration。
2024-09-24 11:04:31 173
原创 datasophon升级海豚调度为3.2.1
修改启动命令,添加jmx与datasophon-api模、模块servive_ddl.json的jmx端口保持一致。修改启动命令,添加jmx与datasophon-api模、模块servive_ddl.json的jmx端口保持一致。2、在worker-server的启动命令中添加api-server的jmx端口号。1、同api-server的修改一致,否则任务启动时无法找到hdfs路径文件。修改master-server的启动脚本。修改worker-server的启动脚本。
2024-08-13 20:34:23 447
原创 JS hook
debugger 使用 Function.constructor / setInterval / eval。一般获取header中的参数。
2024-07-01 22:44:11 835
原创 记录dinky0.6.7+flink1.14.5集成问题
先说一句mmp,这个jar包冲突搞吐我。如果有遇到math3问题需要注意少个包。中配置好flink在hdfs上的lib目录。注意dinky0.6.7版本时的。
2024-06-26 15:20:42 473
原创 Datasophon基于dinky1.0.1升级到dinky1.0.2
opt/datasophon目录原来有软链接指向/opt/datasophon/dinky-release-1.16-1.0.1。之后到服务器查看是否是1.0.2启动。jps -ml 查看dinky进程。我给取消了不知道影不影响。
2024-05-08 19:21:48 445
原创 Datasophon1.2.1集成Dinky1.0.1
通过下图展示的url进去grafana配置图表,默认登陆账户密码:admin :admin。回到datasophon的dinky服务,刷新即可在总览看到详细监控信息。进入datasophon-manager-1.2.1中。重启datasophon-manager的api。配置目录下添加配置模板。
2024-04-26 21:43:34 808 1
原创 在Flink SQL中使用watermark进阶功能
在Flink SQL中使用watermark进阶功能在Flink1.18中对Watermark的很多进阶功能(比如watermark对齐)通过datastream api很容易使用。在sql中使用不是很方便,在Flink1.18中对这些功能进行扩展。在sql中也能使用这些功能。只有实现了接口的源连接器(source connector)(比如kafka、pulsar)才可以使用这些进阶功能。这些进阶的功能都可以使用dynamic table options或 hint进行配置,如果用户同时使用dynamic
2024-03-24 09:55:45 1645
原创 Flink1.18 如何配置算子级别的TTL
举例来说,假设一个 ETL 作业使用 ROW_NUMBER 进行去重操作后, 紧接着使用 GROUP BY 语句进行聚合操作。您可以为去重算子和聚合算子的状态分别设置不同的 TTL。双流 Join 会生成拥有两条输入边TwoInputStreamOperator的状态算子,它用到了两个状态,分别来保存来自左流和右流的更新。table.exec.state.ttl 来控制状态保留,因此它们的状态无法在算子级别进行配置。中,系统会根据两个数据流中元素的时间戳和定义的间隔来决定哪些元素应该被连接在一起。
2024-03-22 19:52:07 621 1
原创 k8s之身份认证与权限
Kubernetes 中提供了良好的多租户认证管理机制,如 RBAC、ServiceAccount 还有各种策略等。通过该文件可以看到已经配置了 RBAC 访问控制。
2023-12-11 14:45:19 680
原创 k8s之高级调度
Pod 亲和力:将与指定 pod 亲和力相匹配的 pod 部署在同一节点。节点亲和力:进行 pod 调度时,优先调度到符合条件的亲和力节点上。Pod 反亲和力:根据策略尽量部署或不部署到一块。
2023-12-10 22:33:10 594
原创 在k8s中部署nfs-client-provisioner
通过这个流程,nfs-client-provisioner 实现了动态创建和管理基于 NFS 的 PV,减轻了管理员的工作负担,同时使开发人员能够更轻松地使用动态的存储资源。需要注意的是,确保您在 PVC 和 StorageClass 的定义中提供正确的配置信息,以确保 nfs-client-provisioner 能够与 NFS 服务器正确交互。
2023-12-09 11:18:29 2238
原创 k8s之服务发布
Ingress 可以理解为也是一种 LB 的抽象,它的实现也是支持 nginx、haproxy 等负载均衡服务的。k8s会根据service关联到pod的podIP信息组合成一个endpoint。各环境访问名称统一、访问 k8s 集群外的其他服务、项目迁移。
2023-12-03 22:17:30 358
原创 k8s之资源调度
startupProbe: #应用启动探针配置httpGet: #探测方式path: /index.html #探测路径#port: 80exec:command:- sh- -c- "sleep 4;failureThreshold: 3 #失败多少次才算失败periodSeconds: 10 #间隔时间successThreshold: 1 #多少次成功算成功timeoutSeconds: 5 #超时时间livenessProbe: #应用启动探针配置。
2023-12-03 21:41:59 481
原创 k8s集群搭建
在部署集群之前,我已经有三台干净的机器(静态ip、防火墙关闭等)。之后采用kubesphere进行搭建。下边是我的kubesphere的创建文件。
2023-12-03 18:11:43 395
转载 Ranger配置hive 插件报错解决Permission denied: user=rangerlookup, access=READ_EXECUTE, inode=“/”
引用至:Ranger配置hive 插件报错解决Permission denied: user=rangerlookup, access=READ_EXECUTE, inode=“/“-CSDN博客
2023-12-01 16:42:36 594
原创 linkedin/coral编译
1.gradle安装如下:https://blog.csdn.net/lxh19930428/article/details/53869408。2.npm安装如下:https://blog.csdn.net/qq_42365082/article/details/127007958。如果是linux编译建议安装git,否则可能会报错。
2023-10-08 20:14:14 156
原创 Flink TaskManager内存优化
在生产使用一段时间后发现 托管内存(默认是Total memory* 0.4)和网络开销内存(0.1)使用较少。所以选择降低这两部分的内存。
2023-09-27 14:58:44 675 1
原创 doris升级到2.0.1启动FE报错
FE 有可能因为某些原因出现无法启动 bdbje、FE 之间无法同步等问题。这时,我们需要手动操作来恢复 FE。手动恢复 FE 的大致原理,是先通过当前。如果你需要将当前已有的 FOLLOWER/OBSERVER 类型的 FE,变更为 OBSERVER/FOLLOWER 类型,请先按照前面所述的方式删除 FE,再添加对应类型的 FE 即可。命令,将之前的其他的 FE 从元数据删除后,按加入新 FE 的方式,重新把这些 FE 添加一遍。中的元数据,启动一个新的 MASTER,然后再逐台添加其他 FE。
2023-09-22 11:20:29 1963 1
原创 解析spark sql将数据血缘并导入datahub
由于我们是spark读取数据写入hudi 但是datahub自带的spark解析貌似不能解析。所以试图通过spline-spark-agent解析并导入datahub。
2023-08-23 17:35:40 1031 2
空空如也
关于#flink整库同步#的问题,如何解决?
2023-03-05
hbase配置kerberos的问题
2023-02-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人