州周-CSDN博客

3.2 没有办法分区的，数据又较快增长的，没办法按照时间动态分区，可以适当放大一下你的bucket数量，按照你的数据保存周期（180天）数据总量，来估算你的bucket数量应该是多少，建议还是单个bucket大小在1-3G。2.【强烈建议】不要使用Auto Bucket ，按照自己的数据量来进行分区分桶，这样你的导入及查询性能都会得到很好的效果，Auto Bucket 会造成 tablet 数量过多，造成大量小文件的问题。3.1 没有办法分区的，数据又缓慢增长的：单个tablet数据量保持在1-3G；

2024-09-30 11:42:35 1788

原创 IDEA远程调试Dinky

最近发现本地和服务器上同样的包但是服务器上的服务报错，特此debug点击RUN---edit configuration。

2024-09-24 11:04:31 296

原创 Datasophon集成tez

【代码】Datasophon集成tez。

2024-09-22 08:19:55 280 2

原创 Dinky1.1.0集成paimon0.9

2024-08-17 10:43:15 337

原创 datasophon升级海豚调度为3.2.1

修改启动命令，添加jmx与datasophon-api模、模块servive_ddl.json的jmx端口保持一致。修改启动命令，添加jmx与datasophon-api模、模块servive_ddl.json的jmx端口保持一致。2、在worker-server的启动命令中添加api-server的jmx端口号。1、同api-server的修改一致，否则任务启动时无法找到hdfs路径文件。修改master-server的启动脚本。修改worker-server的启动脚本。

2024-08-13 20:34:23 810

原创逆向app 思路整理

使用小黄鸟Reqable即可,如果抓不到那就是代理被屏蔽了。3.Frida代码编写。

2024-08-07 23:02:26 467

原创 JS hook

debugger 使用 Function.constructor / setInterval / eval。一般获取header中的参数。

2024-07-01 22:44:11 1140

原创某平台小程序逆向思路整理

python调用解密即可。打断点进入这个加密的方法。

2024-06-26 17:58:23 642

原创记录dinky0.6.7+flink1.14.5集成问题

先说一句mmp，这个jar包冲突搞吐我。如果有遇到math3问题需要注意少个包。中配置好flink在hdfs上的lib目录。注意dinky0.6.7版本时的。

2024-06-26 15:20:42 585

原创 yolov8训练初体验

最近在爬一些数据，有些网址的验证码比较难搞，于是使用yolov8来解决。

2024-06-22 22:26:29 897 1

原创空间验证码训练集获取

最近有个需求在爬取数据时碰到验证码。准备使用yolov8训练模型但没有训练集。基本就是这个大佬的代码：我稍作改动。

2024-06-19 21:52:48 209 3

原创 Datasophon基于dinky1.0.1升级到dinky1.0.2

opt/datasophon目录原来有软链接指向/opt/datasophon/dinky-release-1.16-1.0.1。之后到服务器查看是否是1.0.2启动。jps -ml 查看dinky进程。我给取消了不知道影不影响。

2024-05-08 19:21:48 582

原创 Datasophon1.2.1集成Dinky1.0.1

通过下图展示的url进去grafana配置图表，默认登陆账户密码：admin ：admin。回到datasophon的dinky服务，刷新即可在总览看到详细监控信息。进入datasophon-manager-1.2.1中。重启datasophon-manager的api。配置目录下添加配置模板。

2024-04-26 21:43:34 1100 1

原创 umi-ocr识别文件夹所有文件并导入数据库

最近有个需求是识别身份证所有信息。所以调用umi-ocr接口并写入mysql。

2024-04-05 14:28:38 916

原创 Flink中流式的各种聚合

针对无界聚合算子，

2024-03-24 12:51:36 608 1

原创在Flink SQL中使用watermark进阶功能

在Flink SQL中使用watermark进阶功能在Flink1.18中对Watermark的很多进阶功能（比如watermark对齐）通过datastream api很容易使用。在sql中使用不是很方便，在Flink1.18中对这些功能进行扩展。在sql中也能使用这些功能。只有实现了接口的源连接器(source connector)（比如kafka、pulsar）才可以使用这些进阶功能。这些进阶的功能都可以使用dynamic table options或 hint进行配置，如果用户同时使用dynamic

2024-03-24 09:55:45 2429

空空如也

关于#flink整库同步#的问题，如何解决？

flink cdc重启后这条删除的数据是不能同步到hudi的吗(mysql删除了数据，重启后hudi里还存在这条数据)

hbase配置kerberos的问题