- 博客(111)
- 收藏
- 关注
原创 MySQL8.0数据库开窗函数
MySQL数据库开窗函数,数据分析、数据处理、排行榜,超级实用,但是需要MySQL 8.0 以上版本方可兼容。
2023-06-08 15:31:55
5594
87
原创 PostgreSQL + PostGIS(SQL操作)
判断两个几何体是否重叠(同维度相交但不包含):判断两个几何体是否接触(边界有公共点)替换成其他几何类型名称即可。:判断两个几何体是否完全相同。:判断 A 是否在 B 内部。:判断是否交叉(如线穿过面)在创建表时,也可直接使用。:判断 A 是否包含 B。上述所有类型都可以带。:判断是否在指定距离内。
2026-03-24 18:03:03
225
原创 Nginx部署前后端
本文介绍了前后端项目的打包部署流程及Nginx配置方法。后端使用Maven执行clean和package命令生成jar包;前端通过npm run build:prod命令打包生成dist目录。配置Nginx实现前端静态文件服务和后端接口代理,包括Vue路由的history模式支持。提供了启动和停止服务的批处理脚本,分别用于管理Nginx和后端Java服务。最后通过访问http://localhost即可查看部署结果。
2026-03-21 15:19:36
226
原创 window sever 2019 安装~时序数据库TDengine TSDB 和 视图工具dbeaver
双击 桌面 Taos Shell 图标方可启动,如窗口被关闭TDengine TSDB 服务也会关闭。视图工具 TDengine-server-3.0.7.1-Windows-x64.exe。时序数据库 dbeaver-ce-26.0.0-windows-x86_64.exe。进入 C:\TDengine\cfg 修改taos.cfg。进入C:\TDengine 双击 taos.exe。编辑修改taos.cfg ,指向挂载的位置。复制命令行进 taos.bat。查看是否创建成功命令如下!
2026-03-19 17:39:12
218
原创 windows 安装Docker 教程
访问 Docker 官网的下载安装程序。双击运行下载的 Docker Desktop Installer.exe。双击Docker Desktop Installer.exe出现下图所示查是否是专业或企业版本):在安装向导中,等相关选项。:需要,家庭版无法直接安装:安装前必须完成这两步~:在“控制面板 -> 程序和功能 -> 启用或关闭 Windows 功能”中,确保勾选和。安装后,Docker Desktop 通常会自动启动(系统托盘会出现鲸鱼图标🐳)。打开或,运行以下命令验证。
2026-03-19 16:07:00
495
原创 时序数据库(社区版)TDengine TSDB(安装/Docker版本)
摘要:TDengine 3.4.0.0 Docker社区版提供免费永久使用,推荐采用官方规范的tdengine/tsdb镜像名称。安装时建议创建数据、日志和配置目录进行持久化存储,通过docker-compose.yml文件管理容器,包含6030、6041、6060等核心端口映射。部署后可通过taosExplorer(6060端口)或REST API验证,默认账号root/taosdata,支持通过taos命令行修改密码。注意Windows路径格式、端口冲突和防火墙设置等问题。
2026-03-18 12:59:29
563
原创 PostgreSQL + PostGIS(下载与安装)
PostgreSQL与PostGIS是开源地理空间数据处理的核心组合。PostgreSQL作为功能强大的对象关系型数据库,提供ACID事务、复杂查询和丰富数据类型支持。PostGIS作为其空间扩展,增加了对点线面等几何数据的存储、查询和分析能力,支持坐标转换、拓扑结构和空间索引。文章详细介绍了二者的核心特性、安装方法(包括Windows环境下通过StackBuilder安装PostGIS的步骤)以及如何创建空间数据库并启用扩展。该组合广泛应用于地理信息系统、位置服务和空间分析平台。
2026-03-05 13:27:09
497
原创 Docker 拉取 Kafka 镜像及策略配置
本文详细介绍了在Docker环境下配置Apache Kafka 4.1.1的生产级部署方案。主要内容包括:1基础环境准备和docker-compose.yml文件配置;2 核心参数优化设置,涵盖KRaft模式、数据安全、日志保留、网络吞吐等关键配置;3针对不同业务场景的定制化配置方案,包括高吞吐量、低延迟和数据归档三种典型场景的优化策略;4 组合使用建议,提供了混合工作负载下的平衡配置方案。文章特别强调了生产环境中数据持久化、性能优化和监控配置的重要性,并提供了详细的参数说明和场景对比。
2026-01-30 17:47:52
413
原创 关于增加Iceberg和Flink这样的复杂层,而不是直接操作如MinIO(分布式对象存储系统)?
本文对比了直接查询MinIO与通过Flink+Iceberg查询两种方案在处理海量数据时的差异。直接查询MinIO存在查询速度极慢、无法实现复杂查询和数据关联、缺乏并发控制等问题;而通过Iceberg查询则能实现毫秒级响应、支持标准SQL查询、ACID事务和数据版本回溯等功能。Flink在方案中充当数据管道和元数据提取器的角色,负责实时处理文件元数据并写入Iceberg表。建议在文件数量少且查询简单时使用MinIO,但若需复杂分析或高性能查询,应采用MinIO+Iceberg的智能数据湖架构。
2026-01-30 14:41:26
862
原创 SpringBoot 集成MinIo(根据上传文件.后缀自动归类)
本文介绍了一个基于MinIO的文件存储服务实现方案,包含以下核心内容: 系统配置:通过pom.xml引入MinIO SDK依赖,并在yml配置文件中设置MinIO连接参数 核心组件: MinioConfig:配置MinIO客户端连接参数 MinioService:提供文件上传、下载、删除等操作,支持自动文件分类(图片/视频/文档等)和安全文件名生成 功能特点: 支持单文件/批量上传 自动生成文件分类存储路径(按类型/日期) 提供临时访问URL生成 包含完善的安全校验机制
2026-01-30 14:01:34
762
原创 MinIo开发环境配置方案(Docker版本)
本文提供了MinIO对象存储服务的开发与生产环境配置方案。开发环境采用简化配置,使用HTTP协议和简单密码;生产环境则包含HTTPS加密、强密码认证、资源限制、健康检查等安全措施。
2026-01-29 11:48:06
513
原创 生产环境开箱即用的“Flink + Iceberg 数据湖容器搭建”(Docker)
本文介绍了两种在Flink+Iceberg数据湖运行时容器中处理JAR包的方法。方法一通过挂载本地JAR目录到容器,但需注意JAR冲突问题;方法二推荐使用Dockerfile将JAR包直接构建到镜像中。详细说明了两种方式的docker-compose.yml配置、目录结构、验证方法和操作流程,包括如何启动服务、验证挂载、处理JAR冲突等步骤。重点强调了生产环境下推荐使用运行时添加JAR的方式,并提供了完整的操作命令和注意事项。
2026-01-28 15:04:36
1564
原创 矢量数据库(核心概念)
Milvus是一款专为向量数据设计的数据库,核心存储非结构化数据转换的高维向量及元数据。与传统关系型数据库相比,Milvus专注于向量相似性搜索,支持十亿级数据的毫秒级查询,具备分布式架构和云原生特性。其优势包括高性能检索、高扩展性和丰富功能,但不擅长复杂事务处理,存在一定运维复杂度。该数据库特别适合AI应用场景,需要开发者掌握向量相关概念。
2026-01-26 09:33:55
771
原创 什么是矢量数据库
矢量数据库是专门用于存储和检索高维向量的数据库系统,能够实现基于语义相似度的高效搜索。它将非结构化数据(如文本、图像)转化为向量形式,通过计算余弦相似度等指标来寻找最接近的查询结果。相比传统数据库的精确匹配,矢量数据库支持模糊语义查询,适用于AI应用场景如RAG系统、语义搜索和推荐系统。
2026-01-26 09:33:28
828
原创 MinIO安装(Windows)
本文介绍了Windows系统下MinIO的安装与启动步骤。首先创建Minio文件夹及子目录bin、data、logs,从官网下载文件放入bin目录。启动时需设置用户名(大于3字符)和密码(大于8字符),通过CMD命令启动服务,其中9005为控制台端口,9000为服务端口。文章详细说明了环境变量设置的4种方案(临时变量、重新打开CMD、子进程刷新、命令行参数),并推荐使用启动脚本的最佳实践。最后提醒访问地址为http://127.0.0.1:9000/login,且控制台不可关闭。
2026-01-24 16:07:17
468
原创 数据如何入湖
摘要:MinIO作为对象存储系统,是构建数据湖的理想底层存储,能够保存各类原始数据(结构化、半结构化、非结构化)。非结构化数据直接存储,半结构化数据轻量解析后存储,结构化数据需通过Flink/Spark等计算引擎转换为Parquet/ORC格式,并配合Apache Iceberg管理元数据。这种架构实现了存储与计算分离、数据与元数据分离,使MinIO能高效存储各类数据,而上层组件负责数据的结构化处理和查询优化。
2026-01-24 14:01:59
339
1
原创 Amazon S3 和 MinIO (数据湖的选型)
MinIO与Amazon S3的核心区别在于部署模式和管理方式。S3是亚马逊托管的云存储服务,提供弹性扩展和丰富功能,按使用量付费;MinIO则是开源对象存储软件,需自行部署管理,完全兼容S3 API,适合私有化部署。选择S3适用于公有云场景,追求零运维和云生态集成;选择MinIO则适合需要数据主权、避免厂商锁定的私有环境。两者在数据湖架构中配置方式相同,只需调整endpoint指向对应服务地址。S3适合云原生方案,MinIO是私有化部署的最佳选择。
2026-01-24 14:01:32
907
原创 什么是真正的“数据湖”(核心)
数据湖在完整的技术栈中分为存储层和表格式层。Apache Iceberg属于表格式层,而存储层才是实际存放数据文件的“湖”。
2026-01-24 12:44:24
546
1
原创 Apache Flink+Apache Iceberg(协作关系)
Flink + Iceberg 的组合实质上是将数据湖的存储能力与流计算的实时能力深度融合实时化:让数据湖“活”起来,支持秒级数据新鲜度服务化:数据湖不再只是存储,而是可直接服务业务的数据平台一体化:统一存储、统一计算、统一服务层这种架构正在成为企业构建实时湖仓一体(Real-Time Lakehouse)的事实标准,特别适合需要对海量数据进行实时处理且要求数据一致性的场景。
2026-01-24 10:56:19
1066
1
原创 Apache Iceberg+Apache Flink(安装流程)
本文介绍了Apache Iceberg的核心使用流程,重点说明其作为数据湖表格式解决方案的特点。
2026-01-23 17:28:11
1181
2
原创 Apache Iceberg核心特征
Apache Iceberg 完全适配并且非常适用于 Java 生态,其核心库本身就是用 Java 编写的。Java 是其功能最完整、最底层的接口,也是与各种计算引擎和框架集成的基础。“Iceberg 强在跨引擎查询”是其最核心的优势,指的是 Apache Iceberg 的表格式定义了一套清晰、中立的“通用语言”,能够让多种不同的计算引擎(如 Spark、Trino、Flink、Presto、Hive 等)安全、正确、高性能地读写同一张数据表,并保证数据视图的一致性和ACID事务。
2026-01-23 10:09:14
780
原创 数据湖的描述与决策
Delta Lake是Spark 生态的“原生公民”,在其体系内提供了最完整、最便利的一站式体验。是追求开放与通用的表格式标准,致力于成为跨云、跨引擎的数据湖底层基石。是 “CDC与增量处理专家”,在需要高频率行级更新的场景中表现出色。是 “Flink实时生态的专属核心”,为流处理而深度优化。它们真正的差异点如下技术生态绑定:Delta Lake 与Spark、Paimon 与Flink分别有最深的集成。核心优化场景:Iceberg 强在跨引擎查询与治理,Hudi 强在高频数据更新。市场与开放标准。
2026-01-23 10:08:01
880
2
原创 时序数据库(企业版)TDengine TSDB(安装/介绍~window版本)
一、TDengine 简介,二、概念,三、安装,四、TDengine账号密码修改,五、备份,六、taosd启动异常处理
2026-01-21 20:46:08
1165
原创 实时数据库与时序数据库
时序数据库与实时数据库的核心差异在于应用场景和设计目标。时序数据库擅长处理海量历史数据,采用高效压缩存储,适用于物联网监控、趋势分析等场景;实时数据库则专注于毫秒级数据读写,满足工业控制、高频交易等强实时需求。两者正呈现融合趋势,现代架构中常协同工作:实时库负责前端控制,时序库处理长期存储与分析。选择时需根据数据规模、延迟要求、成本控制等需求权衡。
2026-01-20 16:42:31
379
1
原创 实时数据库与关系型数据库
实时数据库与关系型数据库存在八大核心差异:数据模型(时间序列vs关系型);优先级(写优化vs读优化);一致性(最终一致性vs强一致性);性能焦点(高吞吐写入vs复杂查询);5)查询语言(专用APIvs标准SQL);存储机制(列式压缩vs行式存储);扩展性(水平vs垂直);应用场景(物联网监控vs业务系统)。实时数据库追求高效存储,适合时间序列数据的高频写入;关系型数据库强调完整存储,确保事务可靠性。
2026-01-19 13:51:56
1046
1
原创 Linux安装Docker
Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 或 Windows 操作系统的机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口 (没有 API)。独立的进程运行在每个容器中,并拥有自己的网络和 IP 地址。容器可以在任何机器上运行,无论宿主机的操作系统和配置如何。
2023-08-16 17:50:41
4990
16
原创 实现 cpolar 内网穿透
cpolar是一种安全的内网穿透云服务,可以将内网下的本地服务器通过安全隧道暴露至公网,使得公网用户可以正常访问内网服务。它是一款内网穿透软件,使用简单,只需一行命令即可将内网站点发布至公网,方便给客户演示。cpolar还可以高效调试微信公众号、小程序、对接支付宝网关等云端服务,提高编程效率。此外,cpolar还提供了一些很棒的功能,如实时断点调试微信消息、在发布会上演示新网站、测试连接到本地开发环境后端的移动应用程序等。使用cpolar的高级套餐,用户还可以解锁并拥有更多高级功能。
2023-08-08 11:06:35
2626
6
原创 搭建SVN服务器
你可以在本地创建一个本地的工作副本,然后与中央代码库进行同步,以便在修改文件时进行版本控制。使用SVN,你可以创建中央代码库(也称为版本库),然后将代码、文档、图片等文件添加到该库。每次修改文件并保存时,SVN会自动记录修改的历史记录,并可以在任何时候回滚到之前的版本。它可以帮助团队协作开发,方便地共享和更新代码,同时也可以提供备份和安全控制功能。SVN具有许多命令行和图形界面工具,可以方便地执行各种版本控制操作,例如添加、删除、修改、查看历史记录、合并修改等。
2023-08-07 06:00:00
3493
9
原创 MySQL数据库,冷备份,热备份,温备份,物理备份,逻辑备份
🧊冷备份:离线备份、读、写操作中止;🔥热备份:读、写不受影响;🌡️温备份 :仅可以执行读操作;🏃物理备份:复制数据文件;📝逻辑备份:将数据库逻辑地导出到文件中;
2023-07-19 13:45:46
1436
17
AES (Advanced Encryption) 对称加密(工具类)
2023-07-04
ASR (Asymmetric Signcryption) 非对称加密(工具类)
2023-07-04
redis-desktop-manager.7z
2023-06-30
Redis-64-5.0.10.7z
2023-06-28
Notepad++.7.8.8 ~支持中英文
2023-05-19
Nginx-1.23.4
2023-05-07
apache-ZooKeeper-3.7.1-bin
2023-05-07
idea-Mybatis-Log-Plugin idea插件
2022-12-07
数据库 误删 数据恢复 ,为什么会这样?为什么会报错呢?
2023-05-31
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅