自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(212)
  • 收藏
  • 关注

原创 RAG Embedding 多义消歧完整解决方案

本文从底层原理、离线知识库优化、线上查询优化、模型选型、检索后处理多个维度完整拆解落地方案。

2026-06-01 17:38:47 405

原创 RAG向量检索核心详解:Cosine、Dot、Euclidean

目前主流向量数据库(FAISS、Milvus、Chroma、Pinecone)全部支持三种核心度量方式:Cosine余弦相似度、Dot Product点积、Euclidean欧氏距离。很多新手做RAG踩坑的核心原因:选错相似度算法,导致语义匹配完全失真、检索结果错乱。本文用通俗逻辑、标准公式、直观案例,一次性讲透三者的原理、区别与RAG最优选型方案。

2026-06-01 17:35:09 293

原创 看完《低智商犯罪》,学习Cypher构建知识图谱

《低智商犯罪》都看了吧,是否现在还在回味剧情里每一个人物的刻画,以及每一个案件的编排。看完后咱们就来简单的学习一下,如何把剧集里的人,事件以及各种关系,构建成一个简单的知识图谱。

2026-05-27 13:59:37 348

原创 LangChain DeepAgents 学习笔记

LangChain的DeepAgents已经发布有段时间了,最近的几个版本基本覆盖了大多数智能体都应该有的功能。本笔记基于 LangChain 的 DeepAgents 框架,演示如何构建了一个具有角色扮演能力的 AI 助手,并集成了自定义技能系统。以此方便后续的knowledge review以及vibe coding的reference。

2026-05-19 14:08:49 411

原创 LangChain Deepagent 版本0.6.1中间件一个bug

目前不清楚这个问题是从哪个版本开始的。所以我把版本回退到了2026年4月1日的版本,因为我看视频教程,教程是在4月8日发布的,所以查看了下github的release记录,4月1日的版本是0.5.1,回退到这个版本,问题解决。本文撰写时间是2026年5月18日,目前langchain deepagent的版本为0.6.1。所以使用pip直接install deepagents的默认版本,大概率会遇到我所说的问题。以下代码演示如何卸载当前版本然后安装指定版本的deepagents。以下是我测试的完整代码。

2026-05-19 01:21:38 409

原创 Neo4j笔记(五):查询的处理流程

上一篇讲述了一篇文章如何通过LLM转换成Cypher,然后在Neo4J里运行,形成知识图谱。此篇接着上篇,继续梳理一个用户查询,如何通过图数据库以及大模型去汇总查询结果。

2026-05-10 00:20:11 471

原创 微软 SQL Server 版本演进史:从诞生到 SQL Server 2025

微软 SQL Server 2025发布应该快半年了,不知不觉发现已经跟这位老朋友一起奋斗了25个年头,SQLServer作为全球最受欢迎的企业级关系数据库之一,自 1989 年诞生以来已经走过了近 40 年的发展历程。本文将带你回顾 SQL Server 从第一个版本到最新 SQL Server 2025 的完整演进历史,并重点介绍每个版本的关键新特性。

2026-05-08 22:51:41 567

原创 提升 Text2SQL 准确率

随着大语言模型的爆发,Text2SQL(自然语言转SQL)技术正在重塑我们与数据库的交互方式。本文将系统性地梳理提升 Text2SQL 准确率的核心方法,涵盖提示工程、模型微调、推理增强三大维度。**所有示例基于微软 AdventureWorksDW2016 数据仓库**。

2026-05-08 00:50:16 301

原创 SQLServer Management Studio(SSMS) 22 Copilot 最佳实践学习笔记

在最新的SSMS 22版本中,加入了微软官方的AI工具GitHub Copilot。此篇结合微软官方的文档,汇总了我们作为机长,应该如何跟这位副驾磨合。

2026-05-07 00:11:36 330

原创 SQLServer RAG笔记4:从服务层到前端交互

在之前的文章中,我们完成了 SQLServer 2025 向量数据库的搭建和基本配置。本文将深入介绍服务层和前端部分的三个核心模块:**Embedding 生成**、**数据入库流程**以及**前端交互关键代码**,完成一个基于SQLServer 2025的向量数据库的RAG系统流程。

2026-05-07 00:08:26 240

原创 SQLServer RAG笔记5:为SQLServer 2025配置Ollama

在第三篇笔记中,我们结合Python代码,通过Ollama的嵌入模型,实现了为SQLServer 2025向量数据库生成向量值。从SQLServer 2025开始,是支持直接把大模型作为EXTERNAL MODEL的。此篇将介绍如何配置Ollama里的嵌入模型作为SQLServer 2025的EXTERNAL MODEL。

2026-05-06 14:53:36 279

原创 SQL Server RAG 笔记3:SQLServer2025 向量数据库

在大模型RAG应用中,提起向量数据库大家想到的更多的是Chroma和FAISS,微软也紧跟时代的步伐,并且在2025年底发布的 SQLServer 2025 也提供了原生向量支持,此篇将介绍如何在SQLServer 2025里搭建向量数据库环境。

2026-05-06 00:19:50 291

原创 详解传统RAG、Text2SQL、Graph RAG:适用场景与问题示例汇总

在AI问答与数据查询领域,传统RAG、Text2SQL、Graph RAG是三种核心的技术路径,它们各自有明确的定位、独特的特点,适配不同类型的查询需求。很多开发者在实际项目中会混淆三者的适用场景,本文将详细拆解每个系统的核心特点,明确其适合回答的问题类型,并搭配10个具体示例,帮助大家快速区分、精准选型。

2026-05-05 22:57:24 250

原创 SQL Server RAG 笔记2:图数据库服务层与前端可视化构建

此篇是 SQL Server 图数据库实战的第二篇,继续构建知识图谱前端,将介绍基于 FastAPI 的服务层架构设计,以及 Vue3 + D3.js 前端图可视化实现。内容涵盖 API 路由设计、数据传输模型、前端组件化架构、D3.js 力导向图布局等核心知识点。

2026-05-05 00:20:38 258

原创 SQL Server RAG 笔记1:图数据库构建

在AI开发中,知识图谱是非常火的一个领域,而提到图数据库大家都会第一时间想到Neo4J,其实在SQLServer中早已有支持,此篇将简单演示如何在SQLServer下构建图数据库,实现知识图谱的管理。

2026-05-04 00:46:31 2052 2

原创 Neo4j笔记(四):一篇文章如何入库的

一直很好奇,一篇文章是如何进入到图数据库的,毕竟一篇文章啥格式都有,而写入到图数据库还必须遵从规则和语法,所以这注定不是一个普通RAG或者SQL的过程。此篇讲带大家一起看一下这里都需要经历哪些过程。

2026-04-29 00:23:51 1000

原创 数据仓库笔记 第六篇:PSA 层 SCD2 处理方式

**SCD2(Slowly Changing Dimension Type 2)** 是维度建模中处理历史变更的行业标准且最常用的方案。相比快照方式,SCD2只写入真正发生变化的数据行,通过 `有效期` 字段精确记录每条数据的生命周期,用极低的存储成本实现完整的历史追溯能力。这一篇用详细的代码解释其工作流程。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。

2026-04-28 00:22:36 925

原创 数据仓库笔记 第五篇:Data Mart 层(数据集市)

什么是 Data Mart?Data Mart(数据集市)是数据仓库的**面向主题的子集**,专门为特定业务部门或分析场景服务。我个人建议,前端BI工具,无论是Power BI或者是Tableau,都从这一层取数据,这样一来可以提高前端报表性能,同时也可以降低前端工具的建模难度。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。

2026-04-27 00:08:19 134

原创 数据仓库笔记 第四篇:Star Schema 层(维度建模)

Star Schema(星型模型)是 **Ralph Kimball** 提出的维度建模方法,是数据仓库**面向分析的核心层**。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。

2026-04-27 00:07:31 448

原创 数据仓库笔记 第三篇:常用缓慢变化维处理方式介绍

数据仓库可以帮助我们追溯数据的历史变化,其中最主要的一个方法就是缓慢变化维。此篇主要介绍最常用的缓慢变化维:Type1, Type2, Type3。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。

2026-04-27 00:06:49 314

原创 数据仓库笔记 第二篇:PSA 层(持久化暂存区)详解

PSA(Persistent Staging Area,持久化暂存区)是数据仓库的**第一层持久化存储**,直接接收从业务系统抽取的数据,并**长期保存所有历史版本**。作为数据库的第一层,叫法很多,也有叫stage,也有叫OBS,标准不是非常的统一。在我的系列笔记里都统一使用psa的这个叫法。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。

2026-04-27 00:06:08 278

原创 数据仓库笔记 第一篇:数据仓库的定义、历史与意义

数据仓库(Data Warehouse,简称 DW 或 DWH)是一个**面向主题的、集成的、非易失的、随时间变化的**数据集合,用于支持管理决策。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。

2026-04-27 00:05:21 445

原创 Neo4j笔记(三):数据建模与程序连接实战

环境:macOS + Neo4j + Python

2026-04-26 09:41:28 252

原创 Neo4j笔记(二):Cypher CRUD 完全指南

环境:macOS + Neo4j Browser,此篇简单介绍Cypher的CRUD操作。

2026-04-26 09:40:48 151

原创 Neo4j笔记(一):安装与快速入门

环境:macOS,Docker / Homebrew / Neo4j Desktop 三种安装方式,以及基础概念,快速入门。

2026-04-26 09:40:09 438

原创 Power BI学习笔记第20篇:面试题汇总 · 第三篇:高级应用与最佳实践篇

这一篇不考你记没记住概念,考的是你有没有真正踩过坑、解决过实际问题。答得好不好,一听就知道。

2026-04-26 09:15:50 435

原创 Power BI学习笔记第19篇:面试题汇总 · 第二篇:数据建模与 DAX 篇

数据建模和 DAX 是区分"会用 Power BI"和"真正懂 Power BI"的分水岭。面试官问到这两块,眼睛都在放光——因为答不好的人太多了。

2026-04-26 09:15:03 421

原创 Power BI学习笔记第18篇:面试题汇总 · 第一篇:基础概念篇

面试官问的每一道基础题,都是在试探你对 Power BI 全貌的理解有多深。答不上来?要么是你没动手做过,要么是你没想过为什么要这么做。

2026-04-26 09:14:12 470

原创 Power BI学习笔记第17篇:Power BI Dashboard 常用布局方案推荐

此篇汇总Dashboard常见的布局方式,作为后续设计的参考。

2026-04-25 09:08:21 296

原创 Power BI学习笔记第15篇:企业级报表开发与最佳实践

本文系统介绍了企业级报表开发的最佳实践框架,主要内容包括:1)报表分类与设计流程;2)数据模型架构设计、命名规范和文档标准;3)行级和对象级安全控制;4)实时、增量和全量刷新策略;5)模型、DAX和报表性能优化方法;6)CI/CD部署流程和版本管理;7)使用指标和性能监控体系;8)自助分析架构设计。文章通过表格、流程图和代码示例,全面阐述了企业报表开发从设计到运维的全生命周期管理要点。

2026-04-25 00:42:29 228

原创 Power BI学习笔记第14篇:Power Query 高级数据处理

本文详细介绍了Power Query的高级数据处理技术,主要包括:1) M语言基础与查询步骤链;2) 高级数据获取方法,如多文件合并、动态数据源和Web API调用;3) 复杂数据清洗技巧,包括文本处理、日期转换和数据类型推断;4) 高级合并与连接操作;5) 数据透视与逆透视;6) 自定义函数编写;7) 高级分组聚合;8) 错误处理机制;9) 性能优化策略。文章还总结了Power Query的最佳实践,强调参数化、批量处理和查询折叠的重要性,为高效数据转换提供了全面指导。

2026-04-25 00:41:26 337

原创 Power BI学习笔记第13篇:高级可视化与自定义图表

高级可视化与自定义图表设计要点 本文系统介绍了Power BI中高级可视化技术与自定义图表的设计原则和应用方法。

2026-04-25 00:40:04 350

原创 Power BI学习笔记第12篇:DAX 高级计算与性能优化

这篇文章深入讲解了DAX高级计算与性能优化的关键技术点

2026-04-25 00:39:07 243

原创 Power BI学习笔记第11篇:高级数据建模与关系设计

本文深入探讨Power BI高级数据建模与关系设计,重点介绍了星型模型和雪花模型的优缺点,建议优先采用星型模型以获得最佳性能。详细解析了三种关系类型(一对多、多对多、一对一)及其应用场景,强调关系方向与交叉筛选的重要性。文章还分享了计算组、计算表、角色扮演维度等高级技巧,以及性能优化检查清单。最佳实践总结提出"7要4不要"原则,为构建高效数据模型提供系统指导。

2026-04-25 00:37:22 432

原创 Power BI学习笔记第16篇:Power BI 示例一览

本文摘自微软Power BI官方示例库,目前一共有17篇。此篇借助工具将17个主页的截图汇总在了一起,方便后续在设计Dashboard的时候,能从中获取一些灵感。

2026-04-25 00:18:15 460

原创 OpenClaw 核心八大 MD 文件

简单介绍OpenClaw核心八大 MD 文件,soul.md, identity.md, user.md, memory.md, agents.md, bootstrap.md, skill.md, heartbeat.md。

2026-04-24 15:16:46 190

原创 Power BI学习笔记第10篇:实战案例 — 销售数据分析仪表板

本文介绍了使用Power BI进行销售数据分析仪表板的实战案例。通过模拟2024年销售数据,从数据准备(Excel导入销售明细、产品和客户表)、数据建模(建立表关系和创建日期表),到DAX度量值编写(包括核心KPI、时间智能指标和排名占比计算),详细展示了分析流程。重点讲解了仪表板设计,包含总览页(KPI卡片和趋势图)、产品分析页(堆积柱形图和排名表)、区域分析页(分区柱形图和漏斗图)以及明细数据页(可交互矩阵表)。最后说明了如何添加切片器同步、页面导航和钻取功能,并提供了发布前的检查清单。该案例完整演示了

2026-04-24 00:30:07 472

原创 Power BI学习笔记第09篇:Power BI Service 发布与共享

本文介绍了Power BI Service的发布与共享功能,包括云端报表发布流程、工作区组织管理、多种共享方式(组织内共享/嵌入/公开链接)、数据刷新设置(手动/定时/增量)以及本地数据网关配置。重点讲解了如何将Power BI Desktop报表发布到云端,通过工作区进行团队协作,并确保数据源连接和定时刷新正常运作。文章还强调了不同共享方式的安全注意事项,特别是"发布到Web"功能的风险提示。最后简要提及了移动端使用场景,为完整商业智能解决方案提供云端部署指导。

2026-04-24 00:28:49 344

原创 Power BI学习笔记第08篇:报表交互与筛选器

本文介绍了Power BI中报表交互与筛选器的核心功能,主要包括四种筛选器类型(视觉级、页面级、报表级、钻取)及其应用场景,详细讲解了切片器的添加、类型设置和格式化选项。文章还涵盖了视觉对象间的交互设置、钻取功能实现跨页面分析、书签保存报表状态、同步切片器以及筛选器的高级设置技巧。这些功能共同构成了Power BI强大的数据探索和可视化交互能力,帮助用户灵活分析数据并发现洞察。

2026-04-24 00:28:02 485

原创 Power BI学习笔记第07篇:可视化图表设计与最佳实践

本文系统介绍了Power BI中图表选择与设计的核心要点。主要内容包括:1)图表选择指南,根据分析目的推荐对应图表类型;2)常用图表详细用法,涵盖柱形图、折线图、饼图等7类基础图表;3)条件格式应用,包含数据条、色阶、图标集等可视化技巧;4)报表布局规范,提供经典仪表板布局模板和设计原则;5)自定义视觉对象推荐与安装方法。文章强调可视化设计应遵循"形式服务于功能"原则,通过正确的图表选择和规范的设计布局,使数据故事更加清晰有力。

2026-04-24 00:26:44 485

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除