梦想画家-CSDN博客

原创 Dinky：Apache Flink 的“超级驾驶舱”与一站式实时计算平台

在大数据实时计算领域，Apache Flink 凭借其低延迟、高吞吐和精确一次（Exactly-Once）的语义，已然成为事实上的标准。然而，对于许多开发者和企业而言，Flink 原生的体验往往伴随着“陡峭的学习曲线”：复杂的作业提交命令、分散的运维监控界面、以及繁琐的 Flink SQL 调试过程。正是在这样的背景下，Dinky（原名 dlink）应运而生。作为一个基于 Apache Flink 构建的一站式实时计算平台，Dinky 致力于解决 Flink 在开发、调试、运维和调度全生命周期中的痛点，

2026-07-30 03:00:00 164

原创 Hive Metastore 深度解析：从架构原理到生产级选型指南

在大数据生态系统中，Apache Hive 能够成为数据仓库的事实标准，其核心优势之一便在于它成功地将 SQL 的易用性与 Hadoop 的扩展性结合在了一起。而连接这两者的“桥梁”，正是 Hive Metastore（HMS）。它是 Hive 的中枢神经系统，负责管理所有的元数据。本文将深入剖析 Hive Metastore 的架构模式、存储机制以及在生产环境中的选型策略，帮助开发者构建更稳健的数据平台。

2026-07-30 02:30:00 187

原创告别冷数据焦虑：用 Trino + HMS 打造低成本 S3 数据湖查询引擎

随着业务数据的飞速积累，数仓存储成本往往成为企业 IT 预算中的“隐形杀手”。面对海量历史数据，直接删除可惜，保留又太贵。最优雅的解决方案是将 3 年前的“冷数据”归档至低成本的对象存储（如 S3），并利用 Trino 实现即席查询。本文将手把手带你搭建一套基于 Hive Metastore (HMS) 和 Trino 的轻量级数据湖查询引擎，实现本地 S3 数据的无缝查询与联邦分析。

2026-07-29 21:54:09 155

原创 Trino 实战指南：如何构建下一代湖仓分析引擎？

在现代数据架构中，湖仓一体（Lakehouse）已经成为标准配置。但面对分散在对象存储、关系型数据库、NoSQL 和 SaaS 应用中的海量数据，如何让它们像查询本地表一样简单？Trino（原 PrestoSQL）正是为此而生。它不仅仅是一个查询引擎，更是连接数据孤岛的桥梁。今天，我们将深入 Trino 的核心，探讨如何利用它构建高性能、高可用的数据分析平台。

2026-07-29 21:05:01 163

原创打破数据孤岛：Trino原生机器学习函数从训练到生产化实战

在数据驱动决策的当下，传统机器学习工作流中数据搬运的繁琐与割裂，正成为制约业务敏捷性的瓶颈。Trino原生机器学习插件的出现，为这一难题提供了优雅的解法。本文将深入探讨如何利用Trino在SQL环境中直接完成从特征工程、模型训练到预测评估的全流程。我们将详细解析核心函数体系，并通过完整的实战代码演示如何构建销售预测模型，最终深入剖析模型序列化与持久化方案，助你打通从实验到生产的“最后一公里”。

2026-07-19 21:25:57 257

原创用SQL驱动AI：Trino AI Functions跨源情报分析实战指南

本文介绍了一种将AI能力无缝集成到数据湖仓分析流程的创新架构。通过Trino AI Functions，数据分析师无需离开熟悉的SQL环境，即可对湖仓中的多源数据进行情感分析、实体提取、文本生成等AI处理。文章详细解析了7个核心AI函数的功能，并重点演示了如何通过SQL拼接多源数据构建Prompt，实现跨S3湖仓与PostgreSQL的“跨源情报简报”生成。这种“SQL组装、AI执行”的模式，极大地降低了AI应用门槛，为安全日志分析、金融情报挖掘等场景提供了高效、安全的解决方案。

2026-07-19 20:48:56 499

原创从“浅层”到“深层”：LangChain Deep Agents 实战指南

文章详细阐述了如何利用规划工具、文件系统、子 Agent 分工、自定义工具、持久化记忆以及人机交互审批等六大特性，逐步将一个简单的脚本升级为具备自主规划与适应能力的智能体。本文旨在为开发者提供一套可落地的构建方法论，帮助理解 Deep Agents 与传统工作流（如 LangGraph）的区别及适用场景。

2026-07-07 21:32:33 387

原创告别手动“投喂”：用循环工程（Loop Engineering）解放你的AI生产力

你是否还在像挤牙膏一样，一句接一句地给AI编程助手发送指令？这种“你问它答”的模式正在成为过去式。一种名为“循环工程”（Loop Engineering）的新范式正在崛起，它主张将开发者从繁琐的交互中解放出来，转而成为自动化系统的设计师。本文将深入解析循环工程的五大核心组件，探讨如何构建一个能够自我驱动、自我验证的AI智能体循环，帮助你从“提示词编写者”进化为“AI工作流架构师”。

2026-07-07 21:15:54 197

原创循环工程（Loop Engineering）：从概念辨析到企业智能体落地实战

循环工程（Loop Engineering）作为AI工程的进阶范式，核心是补齐**自主反馈、迭代收敛、自动终止**的闭环能力，是企业智能体从“单次执行”走向“自主作业”的关键。本文清晰辨析其与提示词、上下文、Harness工程的核心关系，结合企业实战场景拆解落地流程，同时完成价值验证，规避概念空谈。

2026-07-05 20:54:47 478

原创破局数据孤岛：制造业基于 Trino 与统一元数据构建灵活数据资产底座

在智能制造转型的深水区，制造企业正面临严峻的“数据烟囱”困境。ERP中的订单数据、MES里的生产工序、IoT平台的海量传感器时序数据以及质检系统记录，往往分散在数十种异构系统中。传统ETL模式不仅耗时费力，还极易产生数据副本与一致性风险。面对这一痛点，采用“存算分离、零数据移动”的 Trino 分布式查询引擎，配合统一的元数据管理平台（如 Apache Gravitino），正成为制造企业破局的关键。

2026-07-05 20:43:40 345

原创 Langflow实现签约客户自动交付流程智能体

本文完整拆解该模板工作逻辑，并提供**钉钉本土化改造方案**，零代码可视化搭建商机成交自动交付流水线，适配企微 CRM、钉钉 OA、国产项目管理工具，打通销售到交付全链路自动化。

2026-06-22 00:30:00 630

原创 [特殊字符] Langflow结合钉钉，打造本土化 AI 智能任务管家

Langflow 的可视化编排能力让构建 AI Agent 变得前所未有的简单。官方提供了一个名为 **TaskFlow Assistant** 的模板，能够利用自然语言处理来自动化管理任务。本文将带你深入拆解 TaskFlow Assistant 的核心逻辑，并重点演示如何将其“本土化”——**将底层存储从 Google 替换为钉钉（DingTalk）OA 系统**，打造真正适合

2026-06-21 18:21:12 754

原创用 Langflow 构建交互式数据仪表盘：从自然语言到智能可视化的全链路实践

传统的数据仪表盘开发链路冗长：业务需求 → SQL 编写 → 后端接口 → 前端图表组件 → 联调部署。每次需求变更都要走一遍完整流程。Langflow 提供了一种全新的范式：**自然语言驱动的双阶段智能体架构**。用户只需用一句话提问——"展示本季度各产品线的收入趋势"——系统就能自动完成 SQL 生成、数据库查询、可视化方案选择、图表代码生成与渲染，端到端交付结果。

2026-06-21 08:57:52 552

原创告别拍脑袋做需求！RICE+Kano双模型，搭配AI智能体搞定全场景优先级决策

做产品、搞迭代、做增长，所有人都会遇到同一个难题：**需求永远做不完，资源永远不够用**。需求池里堆满用户反馈、工单吐槽、业务提案、创新想法，到底先修bug还是先做新功能？优先打磨基础体验，还是投入资源做差异化亮点？不同团队各执一词、 stakeholder扯皮、迭代节奏混乱，几乎是所有产品团队的常态。

2026-06-21 07:00:11 265

原创零代码搞定数据智能分析！Langflow 实现CSV Query Assistant 智能体

如果你也被文档数据处理效率低、多格式文件无法统一分析、统计计算繁琐困扰，今天这款 Langflow 官方预置模板 ——**CSV Query Assistant（自动化文档分析助手）** 能彻底解决痛点：可视化拖拽搭建、支持多格式文件上传、自然语言提问、内置计算器自动完成统计运算，几乎零代码就能搭建专属数据智能分析流水线。

2026-06-20 16:58:37 303

原创基于Langflow构建自动化数据质量稽核流水线：规则校验、脏数据隔离与全场景落地

Langflow 作为开源可视化 AI 工作流编排框架，依托**低代码拖拽编排、DAG 确定性执行、AI 智能稽核、结构化数据分流**能力，打造了一套标准化、可复用、可扩展的数据质量稽核流水线。能够基于自定义业务规则完成全量数据校验，自动区分合规数据与问题数据，实现干净数据流转、脏数据隔离报备，彻底解决数据质量扩散难题，广泛适配企业数字化、智能制造、金融合规、运营分析等多类业务场景。

2026-06-20 16:39:44 276

原创基于 Langflow 构建 AI 驱动的客户行为分群系统

本文将基于 Langflow 官方模板，带你构建一个**AI 驱动的客户行为分群智能体**。该系统结合了 PostgreSQL 数据库查询与 LLM 的逻辑推理能力，能够自动执行 RFM 分析（最近一次消费、消费频率、消费金额）并生成营销策略。

2026-06-19 16:39:14 374

原创用自然语言查数据库 — Langflow 低代码实战详解

Langflow 的"自然语言转 SQL"模板，本质上是一个精心设计的 **AI Agent 管道**：用自然语言作为输入，用 Schema Prompt 作为知识底座，用结构化输出保证数据流的可靠性，最终把 AI 的语言理解能力和数据库的查询能力打通。它的意义不只是"让不懂 SQL 的人也能查数据库"，更在于它展示了一种通用的 AI 落地模式。

2026-06-19 10:14:24 494

原创 Timefold 技术深度解析：开源约束求解器的实战指南

在企业运营中，我们经常面临复杂的资源分配和调度问题：如何为数百名员工安排最优排班？如何规划物流车辆的最短配送路径？如何合理安排课程表避免时间冲突？这些问题都属于 **NP-hard 优化问题**，传统算法难以在合理时间内找到最优解。**Timefold Solver** 作为一款开源的 AI 约束求解器，正在帮助企业高效解决这类复杂规划问题。本文将深入介绍 Timefold 的背景、核心概念、应用场景，并通过实战示例展示其强大能力。

2026-06-14 19:01:48 464

原创 Langflow 技术深度解析：低代码 AI 工作流平台的优势与实践挑战

在 AI 技术快速演进的当下，开发者面临多重挑战。Langflow 作为一款面向开发者的低代码 AI 构建器，正在改变这一现状。我们一起来学习Langflow智能体开发平台。

2026-06-14 18:35:34 443

原创告别“金鱼记忆”：构建具备长期记忆的 RAG 系统，让 AI 越用越聪明

本文旨在探讨如何通过引入分层记忆管理、建构式索引以及动态反馈闭环，将静态的知识检索升级为具备自我进化能力的 Agentic RAG 架构。文章详细阐述了从短期上下文到长期用户画像的工程化落地路径，并指出只有实现知识召回与经验沉淀的双向融合，才能真正打破大模型的认知边界，打造出越用越聪明的专属智能体。

2026-05-31 15:41:49 359

原创 Harness Engineering ：让 AI 智能体从“能用“到“可靠“

为强大的 AI 能力打造"黄金缰绳" —— 不是限制 AI 的能力，而是构建约束、反馈、控制体系，让 AI 跑得又快又稳。

2026-05-31 15:15:51 451

原创从 ERP 出发：用图数据库 + 规则引擎落地供应链知识语义化

本文面向有 ERP/业务系统背景的 Java 工程师，介绍如何从关系型数据库出发，通过图数据库和规则引擎渐进落地知识语义化，以供应链溯源与风险识别为核心场景，给出完整的架构设计和 Java 代码示例。

2026-05-31 11:02:11 421

原创 Smile — Java 生态中最被低估的机器学习框架

在 Java 生态中做机器学习，选择其实不多。Weka 太老、DL4J 太重、Mahout 要搭 Hadoop。但有一个库，功能全、性能好、API 优雅，却很少有人提起——Smile (Statistical Machine Intelligence & Learning Engine)。这个月初（2026年5月4日），Smile 发布了 6.1.0 版本，代码库已经非常成熟。本文从实战出发，带你快速掌握 Smile 的核心功能。

2026-05-31 10:32:28 322

原创园区资产运营AI应用实战：从业务理解到知识图谱

本文以智汇园区资产运营管理为真实案例，完整阐述从业务数据到 AI 可理解的本体模型的全过程。涵盖实体/属性/关系的判断标准、押金等边界案例的建模取舍、Apache AGE + PostgreSQL 的混合架构方案，以及智能问答、合同抽取、驾驶舱等 AI 场景的本体映射方法。适合正在做园区数字化或资产运营 AI 化的产品经理、架构师、开发者阅读。

2026-05-27 20:32:58 610

原创企业级 OpenClaw 实战：多用户身份映射与权限隔离架构指南

在将 OpenClaw（龙虾）引入企业内部，构建业财一体化或跨部门协作的智能体平台时，我们面临的首要挑战就是“多用户环境下的安全与隔离”。OpenClaw 原生设计偏向个人助手，但在企业场景中，我们必须确保 A 员工绝对看不到 B 员工的财务数据，且销售部的 AI 无法执行运维部的删库指令。

2026-05-18 06:15:36 703

原创拒绝“一问一答”！手把手教你在 OpenClaw 中开发多方法交互式 Skill

真实的业务场景中，我们往往需要更复杂的交互——比如让经理点击卡片上的按钮来审批报销单，或者让用户填写表单后提交数据。如何实现这种“有状态、可交互”的业务流？答案就是：在一个 Skill 中编写多个方法。今天，我们就通过一个极具代表性的真实场景—— “差旅报销智能审批” ，带你彻底掌握 OpenClaw 的多方法事件驱动开发模式。

2026-05-17 18:25:23 313

原创打通 ERP 与微信：手把手教你用 OpenClaw 实现“发货即催款”自动化

在企业日常运营中，销售与财务的衔接往往存在时间差。当仓库刚刚完成发货，销售人员如果能第一时间收到提醒并跟进收款，将极大缩短企业的资金回笼周期。今天，我们就来实战一个高价值的“业财一体化”自动化场景：当 ERP 系统生成发货单后，自动通过微信服务号向对应的销售人员推送精美的催款卡片消息。本文将带你基于 OpenClaw（龙虾）智能体，从权限配置、链路打通到核心代码编写，完整落地这套自动化方案。

2026-05-17 17:53:25 603

原创告别重复劳动！手把手教你用 OpenClaw 打造专属 AI 自动化中枢

在 AI Agent（智能体）爆发的今天，如何让你的 AI 助手不再只是“纸上谈兵”，而是真正具备执行能力，去操作你的业务系统、监控网页数据甚至处理突发订单？本文将带你深入 OpenClaw 这一强大的 AI 接入神器，从最基础的 ERP 数据库查询，到进阶的 MCP 协议对接、Webhook 事件驱动以及浏览器自动化实战。

2026-05-16 22:02:48 406

原创 PostgreSQL 图计算双雄：Apache AGE 与 pgGraphBLAS 的融合实战指南

Apache AGE 让 PG 拥有了兼容 openCypher 的图存储与查询能力，而 pgGraphBLAS 则通过稀疏矩阵运算为 PG 注入了高性能的图计算灵魂。本文将深入解析这两者的核心特性，并通过实战案例展示如何将它们结合，构建一个既能灵活建模又能高效运算的混合图数据库架构。

2026-05-05 11:56:05 464

原创 Apache AGE实战指南：从Cypher语法到核心图算法

本文将系统介绍 Apache AGE 与 Cypher 查询语言及 Neo4j 之间的渊源与区别，并深入剖析其在基础路径查找（如最短路径、多跳遍历）与高级图分析（如 PageRank、连通分量）两大领域的算法实现。通过结合真实的 Cypher 实战案例，帮助开发者快速掌握在 AGE 中挖掘复杂关联数据价值的核心技能。

2026-05-04 22:05:21 459

原创 PostgreSQL 物化视图实战：从数据固化到智能刷新的全链路指南

本文基于 PostgreSQL 的物化视图（Materialized Views）特性，详细阐述了如何通过物理存储查询结果来实现毫秒级的数据响应。针对物化视图“数据静态化”与“业务实时性”之间的矛盾，文章提供了一套完整的解决方案，涵盖**手动刷新策略**、**并发无锁刷新技术**、**定时自动化调度**以及**基于时间戳的增量刷新逻辑**。通过结合索引优化与监控机制，帮助开发者在数据新鲜度与查询性能之间找到最佳平衡点，为构建高性能的数据分析系统提供坚实的技术支撑。

2026-05-04 21:00:48 253

原创唤醒沉睡的数据：ERP销售模块接入Apache AGE实战指南

本文将带你通过一套流畅、实用的ETL（抽取、转换、加载）流程，将这些传统数据转化为Apache AGE中的动态知识图谱。我们将通过真实的Python代码示例，手把手教你如何高效地将销售订单、客户、产品等实体及其错综复杂的关系同步至图数据库，为后续构建AI原生的自然语言问答与智能业务预警系统打下坚实的数据底座。

2026-05-03 10:34:31 735

原创拒绝硬编码：将 LangFlow 编排的 AI 工作流无缝接入 OpenClaw

在 AI 智能体（Agent）开发领域，OpenClaw 凭借其极简的执行框架和强大的本地化能力，迅速成为了 GitHub 上的明星项目。而 LangFlow 作为可视化的 LLM 编排工具，让复杂的工作流设计变得触手可及。那么，如何将两者强强联合？本文将深入解析 OpenClaw 的架构逻辑，手把手教你将 LangFlow 编排的 Flow 作为“自定义大模型”接入 OpenClaw，让你的可视化工作流瞬间变身可交互的超级智能体。

2026-05-03 10:05:01 820

原创告别手动Excel比对！用LangFlow搭建“表格数据对比智能体”

在日常的数据分析、财务对账或竞品调研工作中，你是否经常面临这样的痛点：需要对比两份结构不完全一致的Excel表格，或者从两份长篇的PDF报告中提取关键参数进行横向比对。传统做法不仅耗时耗力，还容易因为人工疏忽导致错漏。本文分享如何利用低代码AI编排工具 LangFlow，快速搭建一个能够自动化处理“两个表格数据对比”任务的智能体（Agent）。

2026-05-02 21:02:34 578

原创多LLM智能路由调度：让大模型应用兼顾成本、速度与效果的核心方案

多LLM智能路由调度能力，可自动将用户请求精准匹配至最优模型，全程对用户无感，同时支持调试、异常兜底与灵活配置，彻底解决大模型应用中成本失控、效果不稳定、响应不及时的核心痛点，是企业级AI应用规模化落地的必备核心能力。

2026-05-02 20:18:30 761

原创 ToolGuard：让AI Agent严格遵守企业规则的确定性合规框架

ToolGuard能把企业策略文档自动转化为可执行的Python守卫代码，在工具调用前强制执行合规检查，从根源杜绝越权调用、参数违规等问题，让AI Agent的工具使用从“尽力合规”升级为“必然合规”。

2026-05-01 15:52:45 569

原创 RAG应用基石：从六种文档切分算法看语义完整性

本文将深入解析六种主流切分算法，从简单的标点分割到复杂的语义理解，并结合LangChain实战代码和金融、法律等场景案例，为你揭示如何选择一个能真正保留“语义完整性”的切分策略。无论你是AI应用开发者还是技术决策者，都能从中找到优化检索质量的最佳实践。

2026-05-01 15:13:12 523

原创智能体核心能力体系：Skill、Tool 与 MCP 全解析，从概念到实战落地

本文聚焦大模型智能体（Agent）领域最核心的三大基础概念 ——**Skill（技能单元）、Tool（功能工具）、MCP（模型上下文协议）**，彻底厘清三者的本质定位、层级关系与核心区别，打破行业内常见的概念混淆误区。

2026-05-01 15:09:52 808

原创 Agentic RAG：从“被动检索”到“主动决策”的架构演进

本文深入探讨了Agentic RAG这一新兴范式，解析其如何通过引入“智能体”概念，将静态的检索管道升级为具备规划、决策与反思能力的动态系统。我们将详细拆解其三大核心组件——检索智能体、检索路由器与答案评论家，并通过实战案例展示其工作流程，为构建下一代企业级AI应用提供实用指南。

2026-05-01 09:40:18 543

项目管理调查问卷

项目管理调查问卷，非常好，对于我们确认需求很有帮助！

2012-04-24

《示例学习kettle之Excel Writer步骤》博客文章示例

《示例学习kettle之Excel Writer步骤》博客文章示例代码，很好的Excel Writer步骤学习资料。

2014-09-16

《检查处理kettle数据流中的空行》示例附件代码

《检查处理kettle数据流中的空行》示例附件代码，是学习kettle 的最佳教程示例，可以在blog中看到本教程。

2014-09-05

《在Tomcat上安装部署SAIKU》资源下载

Saiku是一个强大的独立工具，用于查询构建数据集市，如：即席查询报表、图表展示、导出报表成excel或csv格式等。Saiku是基于Mondrian OLAP引擎。本文主要是一步一步解释如何在tomcat下部署saiku，为了让你更好更快的使用。开始之前，假设你已经比较熟悉数据集市数据库，以及如何建立Mondrian Schema。

2015-02-10

《kettle子转换即映射》博客示例代码

《kettle子转换即映射》博客示例代码; http://blog.csdn.net/neweastsun/article/details/39804383

2014-10-05

《使用javascript访问kettle内部组件》示例代码

2014-10-08

《使用kettle把XML文档转换成数据表结构》附件

使用kettle把XML文档转换成数据表结构 blog中的示例附件，需要请下载学习！

2014-09-02

《kettle中使用javascript步骤和fireToDB函数实现自定义数据库查询》代码

kettle中使用javascript步骤和fireToDB函数实现自定义数据库查询

2014-10-29

《kettle中调用java类》示例代码

《kettle中调用java类》示例代码；http://blog.csdn.net/neweastsun/article/details/40022823

2014-10-12

《kettle中实现动态SQL查询》博客文章示例代码

通过示例学习kettle动态查询，可以使用问号占位符或命名参数，并详细说明两者的区别。

2014-09-15

《kettle中访问前一行数据》示例附件

《kettle中访问前一行数据》示例附件学习kettle最佳示例之一

2014-09-05

《job中使用循环》中的示例下载

《job中使用循环》中的示例下载，对学习kettle有帮助

2014-09-04

《job中执行每行》示例下载

《job中执行每行》示例下载，对学习kettle中的循环有帮助

2014-09-04

《详解kettle之User Defined Java Class步骤》示例代码

《详解kettle之User Defined Java Class步骤》示例代码，是最详细的udjc步骤说明文档，有示例理解更容易，更全面。

2014-09-07

《使用kettle批量下载文件》示例代码

使用kettle批量下载文件的示例代码，详细内容可以查看博客对应的文章。

2014-09-10

《在kettle中实现数据验证和检查》示例代码

《在kettle中实现数据验证和检查》示例代码,学习数据验证和检查的最佳示例。

2014-09-17

mysql驱动程序用与Java访问MySQL数据库

2008-09-05

数据库设计规范

设计数据库的全面总结，配合工具，是非常好用的数据库设计工具；跨数据库，一次设计，同时生成不同数据库的创建表脚本；有截图，非常有参考价值；

2013-07-09

饭店运营测试数据，《DuckDB系列教程：如何分析Parquet文件》引用地址：https://blog.csdn.net/neweastsun/article/details/147002265

饭店运营测试数据，学习DuckDB数据分析资料。数据结构如下： ┌────────────────┬─────────────┬───────── │ column_name │ column_type │ null │ │ varchar │ varchar │ varchar │ ├────────────────┼─────────────┼───────── │ order_id │ BIGINT │ YES │ customer_name │ VARCHAR │ YES │ table_number │ BIGINT │ YES │ menu_item │ VARCHAR │ YES │ price │ DOUBLE │ YES │ quantity │ BIGINT │ YES │ order_time │ VARCHAR │ YES

2025-04-04

分析示例数据，《DuckDB统计实战：两步验证小费行为的关键假设》博文中的测试数据，地址：https://blog.csdn.net/neweastsun/article/details/146866

字段信息如下：ride_id date pickup_location dropoff_location fare tip total_amount total_distance_km duration_min payment_type

2025-03-31

EDR（ Endpoint Detection and Response：端点检测和响应）测试数据，这些数据可能来自主流工具用于学习探索性分析

示例数据说明：这个 JSON 数据结构非常全面且详细地记录了一次与端点检测和响应相关的事件信息，从事件本身的基础情况、涉及的设备、文件、进程到各种描述、时间、风险状态等多方面进行了呈现，多条这样的记录组成的数据集可用于安全分析、威胁追踪、系统监控等众多相关场景。《DuckDB：JSON数据探索性分析实战教程》博客中使用的数据，地址：https://blog.csdn.net/neweastsun/article/details/144592773?sharetype=blogdetail&sharerId=144592773&sharerefer=PC&sharesource=neweastsun&spm=1011.2480.3001.8118

2024-12-19

实现项目中，经常需要查看parquet文件的结构，甚至对比两个文件的字段或类型差异本文通过DuckDB完成介绍查看并对比parquet文件结构过程，希望对你有帮助

《duckdb：利用集合操作分析parquet文件结构差异》https://blog.csdn.net/neweastsun/article/details/144589270?spm=1001.2014.3001.5501的资源文件，供下载实际动手需要。

2024-12-19

dbt 学习示例项目，非常适合初学者

虚拟电商场景，包括订单、客户、付款信息。加工生成客户模型和订单模型。通过该示例我们可以快速学习dbt的常用命令，模型开发、模型测试及文档相关知识。前面写了一系列dbt相关博客，但却没有介绍dbt官方提供的入门示例项目。今天带你完整运行该项目，包括数据源配置、运行dbt相关命令，最后生成项目文档。通过实际项目学习，会加深对dbt理解，也建议你卷起袖子，行动起来。学习dbt可以参考我的数据分析工程专栏：https://blog.csdn.net/neweastsun/category_12786252.html

2024-10-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

项目管理调查问卷

《示例学习kettle之Excel Writer步骤》博客文章示例

《检查处理kettle数据流中的空行》示例附件代码

《在Tomcat上安装部署SAIKU》资源下载

《kettle子转换即映射》博客示例代码

《使用javascript访问kettle内部组件》示例代码

《使用kettle把XML文档转换成数据表结构》附件

《kettle中使用javascript步骤和fireToDB函数实现自定义数据库查询 》代码

《kettle中调用java类》示例代码

《kettle中实现动态SQL查询》博客文章示例代码

《kettle中访问前一行数据》示例附件

《job中使用循环》中的示例下载

《job中执行每行》示例下载

《详解kettle之User Defined Java Class步骤》示例代码

《使用kettle批量下载文件》示例代码

《在kettle中实现数据验证和检查》示例代码

mysql驱动程序 用与Java访问MySQL数据库

数据库设计规范

饭店运营测试数据，《DuckDB系列教程：如何分析Parquet文件》引用 地址：https://blog.csdn.net/neweastsun/article/details/147002265

分析示例数据，《DuckDB统计实战：两步验证小费行为的关键假设》博文中的测试数据，地址：https://blog.csdn.net/neweastsun/article/details/146866

EDR（ Endpoint Detection and Response：端点检测和响应）测试数据，这些数据可能来自主流工具 用于学习探索性分析

实现项目中，经常需要查看parquet文件的结构，甚至对比两个文件的字段或类型差异 本文通过DuckDB完成介绍查看并对比parquet文件结构过程，希望对你有帮助

dbt 学习示例项目，非常适合初学者

钻石示例数据，经典的机器学习示例数据，parquet格式、csv格式，方便用户下载学习

Spring Cloud Spring Boot and Netflix OSS.pdf

Elasticsearch Painless Script入门教程--示例数据-sat.json

R实战综合指数评价法示例教程的示例数据

kettle生成xml示例

Elasticsearch Painless Script入门教程--示例数据-sat.json

深入理解 significant terms 和 significant text 分组聚集代码 sports&news.json

YSJSW(Yet Another Java Service Wrapper)

kafka学习资料合集

嵌套聚集示例数据--nested-data.json

Elasticsearch聚合分析实战(2)-employees.json