- 博客(212)
- 收藏
- 关注
原创 RAG向量检索核心详解:Cosine、Dot、Euclidean
目前主流向量数据库(FAISS、Milvus、Chroma、Pinecone)全部支持三种核心度量方式:Cosine余弦相似度、Dot Product点积、Euclidean欧氏距离。很多新手做RAG踩坑的核心原因:选错相似度算法,导致语义匹配完全失真、检索结果错乱。本文用通俗逻辑、标准公式、直观案例,一次性讲透三者的原理、区别与RAG最优选型方案。
2026-06-01 17:35:09
293
原创 看完《低智商犯罪》,学习Cypher构建知识图谱
《低智商犯罪》都看了吧,是否现在还在回味剧情里每一个人物的刻画,以及每一个案件的编排。看完后咱们就来简单的学习一下,如何把剧集里的人,事件以及各种关系,构建成一个简单的知识图谱。
2026-05-27 13:59:37
348
原创 LangChain DeepAgents 学习笔记
LangChain的DeepAgents已经发布有段时间了,最近的几个版本基本覆盖了大多数智能体都应该有的功能。本笔记基于 LangChain 的 DeepAgents 框架,演示如何构建了一个具有角色扮演能力的 AI 助手,并集成了自定义技能系统。以此方便后续的knowledge review以及vibe coding的reference。
2026-05-19 14:08:49
411
原创 LangChain Deepagent 版本0.6.1中间件一个bug
目前不清楚这个问题是从哪个版本开始的。所以我把版本回退到了2026年4月1日的版本,因为我看视频教程,教程是在4月8日发布的,所以查看了下github的release记录,4月1日的版本是0.5.1,回退到这个版本,问题解决。本文撰写时间是2026年5月18日,目前langchain deepagent的版本为0.6.1。所以使用pip直接install deepagents的默认版本,大概率会遇到我所说的问题。以下代码演示如何卸载当前版本然后安装指定版本的deepagents。以下是我测试的完整代码。
2026-05-19 01:21:38
409
原创 Neo4j笔记(五):查询的处理流程
上一篇讲述了一篇文章如何通过LLM转换成Cypher,然后在Neo4J里运行,形成知识图谱。此篇接着上篇,继续梳理一个用户查询,如何通过图数据库以及大模型去汇总查询结果。
2026-05-10 00:20:11
471
原创 微软 SQL Server 版本演进史:从诞生到 SQL Server 2025
微软 SQL Server 2025发布应该快半年了,不知不觉发现已经跟这位老朋友一起奋斗了25个年头,SQLServer作为全球最受欢迎的企业级关系数据库之一,自 1989 年诞生以来已经走过了近 40 年的发展历程。本文将带你回顾 SQL Server 从第一个版本到最新 SQL Server 2025 的完整演进历史,并重点介绍每个版本的关键新特性。
2026-05-08 22:51:41
567
原创 提升 Text2SQL 准确率
随着大语言模型的爆发,Text2SQL(自然语言转SQL)技术正在重塑我们与数据库的交互方式。本文将系统性地梳理提升 Text2SQL 准确率的核心方法,涵盖提示工程、模型微调、推理增强三大维度。**所有示例基于微软 AdventureWorksDW2016 数据仓库**。
2026-05-08 00:50:16
301
原创 SQLServer Management Studio(SSMS) 22 Copilot 最佳实践学习笔记
在最新的SSMS 22版本中,加入了微软官方的AI工具GitHub Copilot。此篇结合微软官方的文档,汇总了我们作为机长,应该如何跟这位副驾磨合。
2026-05-07 00:11:36
330
原创 SQLServer RAG笔记4:从服务层到前端交互
在之前的文章中,我们完成了 SQLServer 2025 向量数据库的搭建和基本配置。本文将深入介绍服务层和前端部分的三个核心模块:**Embedding 生成**、**数据入库流程**以及**前端交互关键代码**,完成一个基于SQLServer 2025的向量数据库的RAG系统流程。
2026-05-07 00:08:26
240
原创 SQLServer RAG笔记5:为SQLServer 2025配置Ollama
在第三篇笔记中,我们结合Python代码,通过Ollama的嵌入模型,实现了为SQLServer 2025向量数据库生成向量值。从SQLServer 2025开始,是支持直接把大模型作为EXTERNAL MODEL的。此篇将介绍如何配置Ollama里的嵌入模型作为SQLServer 2025的EXTERNAL MODEL。
2026-05-06 14:53:36
279
原创 SQL Server RAG 笔记3:SQLServer2025 向量数据库
在大模型RAG应用中,提起向量数据库大家想到的更多的是Chroma和FAISS,微软也紧跟时代的步伐,并且在2025年底发布的 SQLServer 2025 也提供了原生向量支持,此篇将介绍如何在SQLServer 2025里搭建向量数据库环境。
2026-05-06 00:19:50
291
原创 详解传统RAG、Text2SQL、Graph RAG:适用场景与问题示例汇总
在AI问答与数据查询领域,传统RAG、Text2SQL、Graph RAG是三种核心的技术路径,它们各自有明确的定位、独特的特点,适配不同类型的查询需求。很多开发者在实际项目中会混淆三者的适用场景,本文将详细拆解每个系统的核心特点,明确其适合回答的问题类型,并搭配10个具体示例,帮助大家快速区分、精准选型。
2026-05-05 22:57:24
250
原创 SQL Server RAG 笔记2:图数据库服务层与前端可视化构建
此篇是 SQL Server 图数据库实战的第二篇,继续构建知识图谱前端,将介绍基于 FastAPI 的服务层架构设计,以及 Vue3 + D3.js 前端图可视化实现。内容涵盖 API 路由设计、数据传输模型、前端组件化架构、D3.js 力导向图布局等核心知识点。
2026-05-05 00:20:38
258
原创 SQL Server RAG 笔记1:图数据库构建
在AI开发中,知识图谱是非常火的一个领域,而提到图数据库大家都会第一时间想到Neo4J,其实在SQLServer中早已有支持,此篇将简单演示如何在SQLServer下构建图数据库,实现知识图谱的管理。
2026-05-04 00:46:31
2052
2
原创 Neo4j笔记(四):一篇文章如何入库的
一直很好奇,一篇文章是如何进入到图数据库的,毕竟一篇文章啥格式都有,而写入到图数据库还必须遵从规则和语法,所以这注定不是一个普通RAG或者SQL的过程。此篇讲带大家一起看一下这里都需要经历哪些过程。
2026-04-29 00:23:51
1000
原创 数据仓库笔记 第六篇:PSA 层 SCD2 处理方式
**SCD2(Slowly Changing Dimension Type 2)** 是维度建模中处理历史变更的行业标准且最常用的方案。相比快照方式,SCD2只写入真正发生变化的数据行,通过 `有效期` 字段精确记录每条数据的生命周期,用极低的存储成本实现完整的历史追溯能力。这一篇用详细的代码解释其工作流程。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。
2026-04-28 00:22:36
925
原创 数据仓库笔记 第五篇:Data Mart 层(数据集市)
什么是 Data Mart?Data Mart(数据集市)是数据仓库的**面向主题的子集**,专门为特定业务部门或分析场景服务。我个人建议,前端BI工具,无论是Power BI或者是Tableau,都从这一层取数据,这样一来可以提高前端报表性能,同时也可以降低前端工具的建模难度。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。
2026-04-27 00:08:19
134
原创 数据仓库笔记 第四篇:Star Schema 层(维度建模)
Star Schema(星型模型)是 **Ralph Kimball** 提出的维度建模方法,是数据仓库**面向分析的核心层**。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。
2026-04-27 00:07:31
448
原创 数据仓库笔记 第三篇:常用缓慢变化维处理方式介绍
数据仓库可以帮助我们追溯数据的历史变化,其中最主要的一个方法就是缓慢变化维。此篇主要介绍最常用的缓慢变化维:Type1, Type2, Type3。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。
2026-04-27 00:06:49
314
原创 数据仓库笔记 第二篇:PSA 层(持久化暂存区)详解
PSA(Persistent Staging Area,持久化暂存区)是数据仓库的**第一层持久化存储**,直接接收从业务系统抽取的数据,并**长期保存所有历史版本**。作为数据库的第一层,叫法很多,也有叫stage,也有叫OBS,标准不是非常的统一。在我的系列笔记里都统一使用psa的这个叫法。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。
2026-04-27 00:06:08
278
原创 数据仓库笔记 第一篇:数据仓库的定义、历史与意义
数据仓库(Data Warehouse,简称 DW 或 DWH)是一个**面向主题的、集成的、非易失的、随时间变化的**数据集合,用于支持管理决策。此笔记使用的数据库为SQLServer,相应的示例脚本都围绕于此,其它数据库的相应实现会略有不同。
2026-04-27 00:05:21
445
原创 Neo4j笔记(二):Cypher CRUD 完全指南
环境:macOS + Neo4j Browser,此篇简单介绍Cypher的CRUD操作。
2026-04-26 09:40:48
151
原创 Neo4j笔记(一):安装与快速入门
环境:macOS,Docker / Homebrew / Neo4j Desktop 三种安装方式,以及基础概念,快速入门。
2026-04-26 09:40:09
438
原创 Power BI学习笔记第20篇:面试题汇总 · 第三篇:高级应用与最佳实践篇
这一篇不考你记没记住概念,考的是你有没有真正踩过坑、解决过实际问题。答得好不好,一听就知道。
2026-04-26 09:15:50
435
原创 Power BI学习笔记第19篇:面试题汇总 · 第二篇:数据建模与 DAX 篇
数据建模和 DAX 是区分"会用 Power BI"和"真正懂 Power BI"的分水岭。面试官问到这两块,眼睛都在放光——因为答不好的人太多了。
2026-04-26 09:15:03
421
原创 Power BI学习笔记第18篇:面试题汇总 · 第一篇:基础概念篇
面试官问的每一道基础题,都是在试探你对 Power BI 全貌的理解有多深。答不上来?要么是你没动手做过,要么是你没想过为什么要这么做。
2026-04-26 09:14:12
470
原创 Power BI学习笔记第17篇:Power BI Dashboard 常用布局方案推荐
此篇汇总Dashboard常见的布局方式,作为后续设计的参考。
2026-04-25 09:08:21
296
原创 Power BI学习笔记第15篇:企业级报表开发与最佳实践
本文系统介绍了企业级报表开发的最佳实践框架,主要内容包括:1)报表分类与设计流程;2)数据模型架构设计、命名规范和文档标准;3)行级和对象级安全控制;4)实时、增量和全量刷新策略;5)模型、DAX和报表性能优化方法;6)CI/CD部署流程和版本管理;7)使用指标和性能监控体系;8)自助分析架构设计。文章通过表格、流程图和代码示例,全面阐述了企业报表开发从设计到运维的全生命周期管理要点。
2026-04-25 00:42:29
228
原创 Power BI学习笔记第14篇:Power Query 高级数据处理
本文详细介绍了Power Query的高级数据处理技术,主要包括:1) M语言基础与查询步骤链;2) 高级数据获取方法,如多文件合并、动态数据源和Web API调用;3) 复杂数据清洗技巧,包括文本处理、日期转换和数据类型推断;4) 高级合并与连接操作;5) 数据透视与逆透视;6) 自定义函数编写;7) 高级分组聚合;8) 错误处理机制;9) 性能优化策略。文章还总结了Power Query的最佳实践,强调参数化、批量处理和查询折叠的重要性,为高效数据转换提供了全面指导。
2026-04-25 00:41:26
337
原创 Power BI学习笔记第13篇:高级可视化与自定义图表
高级可视化与自定义图表设计要点 本文系统介绍了Power BI中高级可视化技术与自定义图表的设计原则和应用方法。
2026-04-25 00:40:04
350
原创 Power BI学习笔记第11篇:高级数据建模与关系设计
本文深入探讨Power BI高级数据建模与关系设计,重点介绍了星型模型和雪花模型的优缺点,建议优先采用星型模型以获得最佳性能。详细解析了三种关系类型(一对多、多对多、一对一)及其应用场景,强调关系方向与交叉筛选的重要性。文章还分享了计算组、计算表、角色扮演维度等高级技巧,以及性能优化检查清单。最佳实践总结提出"7要4不要"原则,为构建高效数据模型提供系统指导。
2026-04-25 00:37:22
432
原创 Power BI学习笔记第16篇:Power BI 示例一览
本文摘自微软Power BI官方示例库,目前一共有17篇。此篇借助工具将17个主页的截图汇总在了一起,方便后续在设计Dashboard的时候,能从中获取一些灵感。
2026-04-25 00:18:15
460
原创 OpenClaw 核心八大 MD 文件
简单介绍OpenClaw核心八大 MD 文件,soul.md, identity.md, user.md, memory.md, agents.md, bootstrap.md, skill.md, heartbeat.md。
2026-04-24 15:16:46
190
原创 Power BI学习笔记第10篇:实战案例 — 销售数据分析仪表板
本文介绍了使用Power BI进行销售数据分析仪表板的实战案例。通过模拟2024年销售数据,从数据准备(Excel导入销售明细、产品和客户表)、数据建模(建立表关系和创建日期表),到DAX度量值编写(包括核心KPI、时间智能指标和排名占比计算),详细展示了分析流程。重点讲解了仪表板设计,包含总览页(KPI卡片和趋势图)、产品分析页(堆积柱形图和排名表)、区域分析页(分区柱形图和漏斗图)以及明细数据页(可交互矩阵表)。最后说明了如何添加切片器同步、页面导航和钻取功能,并提供了发布前的检查清单。该案例完整演示了
2026-04-24 00:30:07
472
原创 Power BI学习笔记第09篇:Power BI Service 发布与共享
本文介绍了Power BI Service的发布与共享功能,包括云端报表发布流程、工作区组织管理、多种共享方式(组织内共享/嵌入/公开链接)、数据刷新设置(手动/定时/增量)以及本地数据网关配置。重点讲解了如何将Power BI Desktop报表发布到云端,通过工作区进行团队协作,并确保数据源连接和定时刷新正常运作。文章还强调了不同共享方式的安全注意事项,特别是"发布到Web"功能的风险提示。最后简要提及了移动端使用场景,为完整商业智能解决方案提供云端部署指导。
2026-04-24 00:28:49
344
原创 Power BI学习笔记第08篇:报表交互与筛选器
本文介绍了Power BI中报表交互与筛选器的核心功能,主要包括四种筛选器类型(视觉级、页面级、报表级、钻取)及其应用场景,详细讲解了切片器的添加、类型设置和格式化选项。文章还涵盖了视觉对象间的交互设置、钻取功能实现跨页面分析、书签保存报表状态、同步切片器以及筛选器的高级设置技巧。这些功能共同构成了Power BI强大的数据探索和可视化交互能力,帮助用户灵活分析数据并发现洞察。
2026-04-24 00:28:02
485
原创 Power BI学习笔记第07篇:可视化图表设计与最佳实践
本文系统介绍了Power BI中图表选择与设计的核心要点。主要内容包括:1)图表选择指南,根据分析目的推荐对应图表类型;2)常用图表详细用法,涵盖柱形图、折线图、饼图等7类基础图表;3)条件格式应用,包含数据条、色阶、图标集等可视化技巧;4)报表布局规范,提供经典仪表板布局模板和设计原则;5)自定义视觉对象推荐与安装方法。文章强调可视化设计应遵循"形式服务于功能"原则,通过正确的图表选择和规范的设计布局,使数据故事更加清晰有力。
2026-04-24 00:26:44
485
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅