- 博客(586)
- 资源 (5)
- 收藏
- 关注
原创 9:MemNet记忆层使用,实现大模型对话上下文记忆
本文介绍了一个带记忆功能的聊天系统MemNet,该系统通过三个解耦但协作的模块实现:1)MemNet_Embedder将文本转换为向量;2)MemNet负责记忆的存储与检索;3)LLM结合当前问题和检索到的记忆生成回答。系统工作流程包括:用户输入问题→MemNet检索相关记忆→将记忆拼接到提示词中→LLM生成回答→存储新记忆。该系统能有效保持对话上下文,如能记住用户名、年龄等信息,并在后续对话中准确调用这些记忆,相比无记忆层的系统具有明显优势。文章还详细说明了代码实现原理和各模块的职责划分。
2026-02-02 21:45:00
911
原创 10:什么是 RAG?一文讲清大模型的“外挂大脑”
RAG(检索增强生成)是大模型落地业务场景的核心架构,解决了模型知识静态、幻觉问题和微调成本高等痛点。它通过检索外部知识库增强生成过程,使回答有据可依、可验证且可更新。RAG流程包括文档准备、向量化、存储、检索和生成,显著提升企业知识库、智能客服等场景的可用性。虽然RAG不增强推理能力,但已成为大模型工程化的必经之路,是AI应用的默认架构选择。
2026-02-02 21:45:00
543
原创 qdrant向量数据库
Qdrant是一个专为向量相似度搜索设计的高性能数据库,采用Rust编写,核心架构包括HNSW索引、向量存储和元数据存储。它支持REST/gRPC接口,提供单机、集群和云原生部署方式。Qdrant采用开源模式(Apache 2.0),商业版提供托管服务。主要功能包括快速向量检索、高效过滤和可扩展性,适用于AI和机器学习场景。部署方式简单,可通过Docker快速启动,并内置Web管理界面。典型应用包括创建集合、插入向量数据和执行相似度查询等操作。
2026-01-30 22:00:00
1778
原创 PGVector 的两种主流 ANN 索引:IVFFlat 与 HNSW
特性IVFFlat (倒排文件)HNSW (分层图)核心原理空间划分 (聚类)图导航 (小世界网络)构建速度快 (基于 K-Means)慢 (需逐个插入节点构图)内存占用较低较高 (存储图的边)查询速度中等偏快 (取决于 probes)极快(通常是最快的选择)精度 (Recall)好 (可通过 probes 调整)极好数据要求建索引前需要有数据以计算聚类中心可在空表上创建,随数据插入动态更新适用场景数据集非常大,内存受限,或需要频繁批量重建索引的场景。
2026-01-30 21:00:00
832
原创 PGVector 详解:PostgreSQL 世界里的向量能力插件
PGVector 是 PostgreSQL 生态中非常优秀的向量插件简单、稳定、低成本无法成为以向量为中心的系统核心当向量只是“辅助能力”,PGVector 是最佳选择;当向量成为“系统主角”,就该让 PostgreSQL 退回它最擅长的位置。
2026-01-29 22:00:00
1071
原创 向量数据库是什么:原理、必要性与应用全景
向量数据库,是一种以“向量”为核心数据模型,专门用于高效存储、索引和检索高维向量,并支持相似度搜索的数据库系统。在海量高维数据中,快速找到“最相似的那些”。现实世界对象在“特征空间”中的数值化表示。对象向量来源典型维度文本Embedding 模型(BERT / Qwen / OpenAI)图片CNN / ViT512 / 1024音频声学模型256 / 512用户行为特征工程几十到几百例如:“MySQL 是一个数据库”这个向量在数学空间中的“位置”,就代表了这段文本的。
2026-01-27 21:00:00
1697
原创 向量数据库 vs 向量插件(以 PGVector 为代表):工程边界与选型逻辑
在传统数据库中,引入一种新的数据类型(vector)和相关算子。提供vector(n)类型提供距离函数(L2 / cosine / inner product)提供向量索引(IVFFlat / HNSW)它并没有改变 PostgreSQL 的核心架构。数据模型围绕 vector 设计存储、索引、缓存都为向量服务查询的第一目标是 Top-K 相似度这与“在数据库里加一列 vector”有本质区别。PGVector 不是“低配向量数据库”,而是定位完全不同的工具是否上独立向量数据库,取决于。
2026-01-27 21:00:00
823
原创 8:大语言模型是无状态以及大语言模型的基石Embedding
摘要: 大语言模型(LLM)的无状态性指其不保留请求间信息,每次推理独立完成,确保可扩展性和并发性。记忆功能通过外部拼接Prompt实现,模型本身仅处理当前输入。Embedding是LLM的基石,将符号映射为连续向量,构建语义空间,使模型能处理文本、代码等多模态数据。两者结合形成RAG(检索增强生成)的核心:无状态模型通过外部Embedding索引长期记忆,Prompt提供短期上下文。这一设计平衡了规模化需求与语义理解能力,使LLM成为高效但无记忆的“超级大脑”,依赖Embedding作为理解世界的数学坐标
2026-01-26 22:15:00
1418
原创 9:大模型向量的使用
本文探讨了智能客服系统的演进历程与技术突破。三年前主流的"卡片式FAQ"交互模式(用户点击预设问题获取答案)虽降低了使用门槛,但面临自然语言表达的多样性挑战。为解决这一问题,向量嵌入(Embedding)技术成为关键转折点,通过将语义相似度转化为可计算距离,实现了从字符串匹配到语义检索的升级。文章详细分析了智能客服的四个发展阶段,并提供了一个C#实现的Embedding相似度检索Demo,展示如何将用户查询与知识库内容进行语义匹配。这一技术突破为后续RAG和对话式生成奠定了基础,标志着智
2026-01-26 22:15:00
1669
原创 7:大模型资源汇总
特点:一站式平台 + “模型广场/模型列表”,覆盖 Qwen 以及第三方模型;官方强调兼容 OpenAI 接口,迁移只需改 key/base_url/model。阿里云百炼 - 零基础快速上手AI应用搭建 - 阿里云。
2026-01-26 22:00:00
1093
原创 微软AI库Microsoft.Extensions.AI的发展历史和背景介绍
Microsoft.Extensions.AI:.NET官方的AI基础设施抽象层 这是一个标准化的AI能力接口规范,旨在将各类大模型(LLM/Embedding/Image等)统一为.NET标准接口,深度融入Microsoft.Extensions生态。它并非具体模型或AI框架,而是类似ILogger的基础设施组件,提供IChatClient、IEmbeddingGenerator等通用接口。
2026-01-21 21:00:00
667
原创 5:微软AI库Microsoft.Extensions.AI的使用与流式响应
摘要: 本文展示了一个使用Microsoft.Extensions.AI抽象接口调用阿里云百炼大模型的C#代码示例。该代码通过OpenAI SDK兼容模式访问Qwen3模型,实现了英语学习辅助功能:提取英文句子中超出初中教材范围的单词并转换为原型形式,对超出范围的问题会拒绝回答
2026-01-20 21:00:00
2182
原创 6. 简单将原生代码改为流式请求
文章摘要: 本文展示了如何实现大模型流式响应功能,通过C#代码示例演示了与多个AI平台(如Deepseek、阿里云百炼、本地llama3等)的兼容对接。核心代码ChatStreaming类采用HTTP SSE协议处理流式响应,支持解析不同平台返回的JSON数据格式(包括delta.content和message.content两种常见路径)。代码提供了完整的流式请求实现,包括错误处理和原始数据调试功能,可灵活适配多种大模型API接口。
2026-01-20 21:00:00
1659
原创 3:本地部署大模型
本文介绍了使用Docker安装和运行Ollama平台的详细过程,以及测试Llama3和mxbai-embed-large两个AI模型的效果。首先通过Docker命令拉取并运行ollama/ollama镜像,然后分别安装Llama3和mxbai-embed-large模型。测试结果显示,Llama3能够进行流畅的中英文对话,展示了其在语言理解和生成方面的能力;而mxbai-embed-large则成功将文本转换为向量表示。文章详细记录了安装过程中的命令行操作和模型交互过程,为AI模型的部署和使用提供了实用参考
2026-01-15 21:30:00
307
原创 4. Docker + Ollama 大模型管理
Ollama 是一个本地化大语言模型管理平台,提供类似 Docker 的模型运行环境和 OpenAI 风格的 API。本文系统介绍了其在 Docker 环境下的部署与使用:1) Ollama 支持官方 Registry 和 Hugging Face 的 GGUF 格式模型;2) 推荐通过挂载 volume 方式部署 Docker 容器;3) 详细说明模型下载、查看、删除等管理操作;4) 特别说明 Qwen3 等模型的使用限制,需确保使用 GGUF 格式。
2026-01-15 21:30:00
1403
原创 1:跟着【杨中科】学大模型专栏介绍
AI是什么,我们在技术求索路上我们不下牌桌明白AI是什么,底层逻辑是什么本地部署大模型以及AI的原理调用微软AI库以及流式输出大预言模型的基石Embedding向量数据库和MemNetRAG和FunctionCalling。
2026-01-14 22:30:00
399
原创 2:调用大模型
大模型参数规模极大(通常 ≥ 数十亿参数)、在海量通用数据上进行预训练、可通过微调或提示(Prompt)适配多任务的通用模型。大语言模型(LLM, Large Language Model)或更广义的基础模型(Foundation Model)
2026-01-14 22:30:00
1154
原创 阿里云百炼
阿里云百炼(Model Studio)是阿里云推出的一体化大模型服务平台,为企业及开发者提供大模型开发、训练、部署与应用构建的全流程工具链。平台支持通义系列等主流模型,具备模型调用、微调训练、私有知识库构建、可视化开发等核心功能,并兼容OpenAI API规范。其优势在于免运维基础设施、企业级安全治理及低代码开发能力,适用于智能客服、知识检索、内容生成等场景。用户可通过阿里云控制台快速开通服务,按模型调用量计费,支持免费额度测试。
2026-01-13 22:00:00
2434
原创 基于 Java Compiler API 的静态代码分析工具的使用说明
该代码分析工具支持三种使用方式,本文重点介绍了Maven集成方式。通过配置pom.xml文件,添加analyzer-maven-plugin插件,可在verify阶段自动执行代码分析。插件支持多项配置,包括是否包含测试代码、失败处理策略、输出格式等,分析结果默认生成SARIF格式报告并保存在target/analyzer目录下。执行mvn verify命令即可触发分析,并支持自动打开分析报告。
2026-01-13 22:00:00
314
原创 HuggingFace
官方对 Hub 的定义是:一个集中分享、探索、发现、实验开源机器学习成果的平台,并给出规模级别(模型、数据集、应用数量)用于说明其生态体量。首页把 Hugging Face 的开源栈以“目录”方式列出(例如 Transformers、Diffusers、Safetensors、Tokenizers、PEFT、Text Generation Inference、Accelerate 等)。定价页描述 Hub 的免费层定位为“探索、实验、协作与构建”,并强调其 Git 协作属性与内建 ML 功能。
2026-01-12 23:00:00
1025
原创 modelscope魔搭社区
ModelScope(中文名:魔搭社区)是阿里巴巴集团旗下阿里云与达摩院联合推出的一站式开放式 AI 模型平台,定位于模型即服务(Model-as-a-Service, MaaS)的共享生态。丰富的预训练 AI 模型库模型探索、在线体验、推理、训练、部署与应用模型开发全流程支持它类似国外的 Hugging Face,但针对中文用户环境和国内使用习惯进行了本地化和优化。魔搭社区使用 API 或 SDK 集成模型服务利用训练功能优化模型到特定业务数据(aibook.ren。
2026-01-12 23:00:00
1272
原创 obsidian_url_clipper插件介绍
Obsidian URL Clipper 是一款专为 Obsidian 设计的网页剪藏插件,通过可视化正文选择器精准抓取网页内容。核心功能包括:1)支持任意 URL 转换为 Markdown;2)鼠标交互式选择正文区域,自动生成 CSS/XPath 路径;3)可选图片本地化存储;4)模块化架构便于扩展。该插件特别适合技术博客剪藏、爬虫规则配置和知识管理,解决了传统剪藏工具无法过滤侧边栏/广告等噪音的问题。设计理念强调精准控制、原生体验融合和高级用户可调试性,实现"真正控制网页结构"的目标
2026-01-09 22:30:00
1486
原创 Halo自建站博客介绍
Halo是一款基于Java/Spring Boot的开源CMS系统,提供博客、企业网站等内容管理功能。核心特点包括:支持Markdown编辑、主题/插件扩展灵活、内置Vue管理后台,提供Docker等多种部署方式。采用模块化架构和API优先设计,技术栈包含Netty和R2DBC以提升性能。适合开发者快速搭建可定制网站,社区活跃并提供丰富主题插件资源。通过Docker Compose可快速部署,整合PostgreSQL数据库,支持健康检查等企业级功能。
2026-01-08 22:30:00
2242
原创 Java Compiler API动态编译代码Demo
本文演示了如何动态编译并执行Java代码。主要内容包括:1)通过字符串形式编写Java源码;2)使用Java Compiler API在内存中编译代码而不落磁盘;3)通过自定义ClassLoader加载并执行编译后的类。项目包含两个Demo:编译字符串并运行(CompilerDemo)和编译文件并运行(FileCompileAndRunDemo)。核心实现涉及内存中的Java源文件(MemorySourceJavaFileObject)、内存中的class文件(MemoryByteCodeJavaFileO
2026-01-06 21:00:00
325
原创 基于 Java Compiler API 的静态代码分析工具
本文介绍了一个基于Java Compiler API的静态代码分析工具,用于检测Java代码中的常见问题。该工具提供核心分析引擎、命令行工具和Maven插件三种使用方式,支持自定义规则扩展和多种输出格式(SARIF、Sonar外部问题JSON)。内置规则包括禁止使用System.out.println、空catch块等常见问题检测。项目要求JDK 17+和Maven 3.6+环境,可通过Maven命令构建。用户可以通过命令行参数或Maven插件配置进行分析,并支持添加自定义规则。输出结果可集成到SonarQ
2026-01-05 21:00:00
963
原创 Java Compiler API
Java Compiler API(JSR 199)是Java 6引入的标准化编译接口,旨在将javac的核心能力以可编程API形式暴露。它位于javax.tools包下,提供JavaCompiler、JavaFileObject等核心组件,支持运行时编译、内存编译和注解处理集成。该API广泛应用于代码分析、动态执行、插件系统等场景,但相比Roslyn在AST操作和现代性上有所不足。作为官方标准方案,它实现了将javac工具库化的目标,为Java生态提供了基础的编译基础设施。
2026-01-05 21:00:00
900
原创 CSharp 编译器的历史(Roslyn 的诞生)
C#编译器从封闭走向开放的演进历程:2000年C#诞生时采用C++编写的黑盒编译器,仅关注编译功能;2006年后语言复杂度暴增导致IDE与编译器脱节,开发体验恶化;2010年微软决定用C#重写编译器,2015年推出Roslyn平台,将编译过程拆解为开放API,实现IDE与编译器统一,支持静态分析和快速语言迭代。Roslyn标志着编译器从工具转变为基础设施,推动了C#生态的质变。
2026-01-04 21:00:00
1535
原创 基于 Roslyn 的 C# 代码静态分析工具,用于生成 SonarQube 兼容的外部问题报告
本文介绍了如何结合Roslyn代码分析工具与SonarQube平台,实现自定义代码规则的静态分析。主要内容包括:1)SonarQube项目创建步骤,重点说明了令牌生成与保存的重要性;2)基于Roslyn的C#代码分析工具(Company.CSharpConsoleGuard)的使用方法,该工具支持自定义规则检查,并能生成SonarQube兼容的JSON报告;3)详细说明了配置文件格式和工具运行方式,可实现与SonarQube的无缝集成。该方案适用于需要定制企业级代码规范检查的场景,提供了从代码分析到结果推送
2026-01-04 09:57:13
1401
原创 PG GraphQL详细介绍与基本使用
IMDB图数据库查询优化摘要 本文介绍了在PostgreSQL上构建IMDB图数据库并进行查询优化的过程。主要内容包括: 表结构说明:详细解释了IMDB数据库中的三张核心表(作品表、人物表、关系表)及其关键字段。 数据准备:通过SQL查询从全量数据中提取2015-2018年间的小规模数据集(2000部作品及相关人物关系),用于后续性能测试。 查询效率比对:以"两人是否合作过"为例,展示了Cypher查询的执行计划分析,包括嵌套循环、索引扫描等操作,总耗时约1.35ms,涉及297次缓冲区
2026-01-01 21:00:00
916
原创 PG GraphQL AGE 使用结论(2025-12-30)【祛魅万物皆可Postgresql】
本文对比了SQL与AGE(Cypher)在处理固定模式图查询时的性能差异。实验数据显示,SQL在执行时间(171ms vs 1317ms)、内存使用(69 vs 5810 shared hit)和临时文件(4MB vs 51MB)等方面显著优于AGE。分析指出,AGE的核心价值在于为PostgreSQL提供形式上的图数据库能力(支持Cypher查询),而非性能优势。在固定深度、固定关系的结构化查询场景中,SQL的关系代数实现仍具有更高效、更可控的优势。文章最终定性:AGE的意义是让PostgreSQL具备图
2026-01-01 21:00:00
263
原创 docker安装pgvector、age和postgis
本文介绍了使用Docker Compose配置PostgreSQL扩展环境的方法,包含PostGIS、pgvector和Apache AGE三个扩展服务。PostGIS提供地理空间数据处理能力,支持空间查询和分析;pgvector支持向量存储和相似度搜索,适用于机器学习场景;Apache AGE则为PostgreSQL添加图数据库功能,支持图数据模型和查询。文章详细说明了各扩展的主要功能、典型应用场景,并提供了PostGIS扩展的安装和版本查询SQL示例。通过docker-compose.yaml文件可实现
2025-12-31 21:00:00
1324
原创 导入数据到OG GraphQL以及创建graph
本文介绍了从IMDb数据集下载和处理数据的完整流程。首先通过Python脚本将IMDb提供的TSV.GZ格式数据文件(包括title.basics、name.basics和title.principals)导入PostgreSQL数据库,建立了包含主键和索引的规范化表结构。随后通过SQL对数据进行筛选整理,创建了精简版数据集small_title_basics(2015-2018年的电影/剧集)及其关联的演职员表small_title_principals和small_name_basics。整个流程涵盖了
2025-12-31 21:00:00
803
原创 PostgreSQL:万物皆可PostgreSQL的力量
PostgreSQL作为开源关系型数据库,凭借强大的扩展性和灵活性构建了丰富的生态系统。通过PostGIS、TimescaleDB等扩展,它能处理GIS、时间序列、机器学习等多种数据场景。虽然面临生态碎片化挑战,但其高定制性、社区支持和稳定性仍使其优于MySQL、MongoDB等数据库。PostgreSQL正朝着统一平台方向发展,成为"万物皆可"的数据解决方案,为开发者提供处理各类需求的强大工具。
2025-12-30 21:30:00
919
原创 写一个简单的DebugView
本文介绍了一个Windows调试信息查看工具SimpleDebugView,它能实时捕获并显示通过OutputDebugString输出的调试信息。该工具具备进程ID/关键字过滤、暂停/继续监控、日志清除等功能,采用Windows DBWIN机制通过共享内存和事件通知实现。基于.NET Framework 4.6+开发,提供简洁的Windows Forms界面,支持直接运行或源码编译。项目包含核心监控器、消息结构和主界面三个主要组件,同一时间仅允许一个实例运行。项目代码已开源在GitHub。
2025-12-30 21:00:00
534
原创 DebugView++介绍与使用
摘要: DebugView++是一款开源的Windows调试输出查看工具,旨在增强Microsoft Sysinternals的DebugView功能。它支持监听Win32 Debug Output,提供正则表达式过滤、多Tab观察、高亮显示等工程友好特性,适用于长期调试场景。与闭源的DebugView相比,DebugView++基于现代C++/Qt开发,持续维护且扩展性强。其开源地址为GitHub上的CobaltFusion/DebugViewPP仓库,采用宽松的Boost许可证。适用于高频输出、复杂过滤
2025-12-26 21:00:00
1323
原创 DebugView初使用
本文介绍了使用DebugView工具和.NET 4.6实现日志输出的方法。首先从微软官网下载DebugView工具,然后通过.NET开发设计界面,提供了日志增强类ConsoleEnhancer和TeeTextWriter,可将Console输出同时显示在DebugView中。文章包含界面设计代码、日志增强类实现代码,并展示了最终效果,帮助开发者实现便捷的日志调试功能。
2025-12-25 21:30:00
579
原创 DebugView介绍
DebugViewer是用于实时捕获和显示调试输出的工具,最知名的实现是微软Sysinternals的DebugView。它无需附加调试器即可监听程序通过调试接口(如OutputDebugString)输出的日志信息,支持用户态和内核态调试输出。核心功能包括多进程统一视图、过滤高亮、日志保存等,适用于生产环境问题排查、第三方组件调试等场景。但与正式日志系统相比,DebugViewer缺乏结构化、持久化等特性,仅适合临时调试。另有开源增强版DebugView++提供更现代的功能。
2025-12-25 21:00:00
1146
C#委托代码样例DelegateDemo
2022-02-22
neo4j-community-3.5.3-windows和neo4j-community-4.1.3-windows
2020-10-26
1Docx文档开源操作.rar
2020-02-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅