自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 收藏
  • 关注

原创 LaTeX公式完全指南:从入门到精通

LaTeX是一种专业的排版系统,专门用于科技文档和数学公式的排版。文章详细介绍了LaTeX的基本用法。

2025-11-06 06:00:00 1373

原创 深入解析Milvus挂载卷:etcd, minio, milvus三大文件夹

Milvus核心文件夹解析:etcd、minio、milvus功能详解。Milvus数据库中的etcd、minio和milvus三个核心文件夹分别承担元数据存储、数据仓库和运行记录的关键角色。etcd作为"大脑"存储所有元数据,minio作为"仓库"保存实际向量数据,而milvus则记录系统运行日志和配置。

2025-11-05 07:00:00 1433

原创 LangGraph 实战(三):添加记忆功能

本文介绍了如何为聊天机器人添加记忆功能,使其能够记住对话历史。通过使用LangGraph的MemorySaver类,实现了状态的保存和恢复。

2025-11-05 06:00:00 781

原创 LangGraph 实战(二):添加工具使用能力

本文介绍了如何通过集成Tavily搜索API来增强聊天机器人的外部知识获取能力。修改后的聊天机器人能够自动识别需要外部信息的问题,调用搜索工具获取结果,并生成基于真实网络信息的回答。

2025-11-04 07:00:00 1477

原创 LangGraph 实战(一):构建一个基础的聊天机器人

本文介绍了如何使用LangGraph构建一个基于DeepSeek大模型的简单聊天机器人。详细说明了构建过程:定义状态类、初始化DeepSeek模型、创建节点函数以及构建状态图结构。最后实现了一个支持流式响应的命令行交互程序,用户可以通过输入文字与机器人对话。该示例展示了LangGraph的核心概念和工作流程,为开发更复杂应用奠定了基础。

2025-11-04 06:00:00 640

原创 DeepSeek-OCR 深度解析

DeepSeek团队开源的DeepSeek-OCR模型创新性地将文本"画"成图像处理,实现高效信息压缩。该模型通过局部感知和全局压缩的双阶段设计,能将1000个文本Token压缩为100个视觉Token并保持97%的OCR精度,显著提升长文本处理效率。

2025-11-03 15:07:13 895

原创 CSDN 删除所上传的资源

本文介绍了删除CSDN已上传资源的具体方法。

2025-11-03 11:03:05 157

原创 linux 工具

本文介绍了在Linux和Windows系统中安装可用工具的步骤。

2025-11-03 09:46:38 153

原创 Docker vs Conda:环境管理的两大神器

本文深入对比Python开发中常用的环境管理工具Conda和Docker。

2025-10-31 17:54:54 1043

原创 LangGraph vs CrewAI vs OpenAI Swarm:三大AI框架

LangGraph是一款专为构建复杂AI工作流设计的开源框架,采用图结构建模组件关系,支持持久执行、人机协作和全面记忆管理等核心功能;CrewAI强调人机协作易用性,适合团队任务自动化;OpenAI Swarm则擅长大规模数据处理。

2025-10-31 16:59:48 525

原创 Transformer与CNN的本质区别:从局部感知到全局洞察的演进

CNN与Transformer的核心差异分析:CNN采用局部连接和权重共享,通过层级结构逐步扩大感受野,适用于图像处理等局部相关性强的任务;Transformer依靠自注意力机制直接建立全局关联,擅长处理序列数据中的长距离依赖。

2025-10-30 11:24:52 1059

原创 FastChat 框架部署 BGE 模型

本文介绍使用 FastChat 框架部署一个兼容 OpenAI API 接口的 BGE 模型的完整流程,以及使用 FastChat 框架进行部署的原因、优势。

2025-10-30 10:05:08 939

原创 curl: (77) error setting certificate verify locations

当使用curl命令时出现"(77) error setting certificate verify locations"报错,通常是由于Anaconda自带的curl使用了不完整的CA证书路径。

2025-10-22 17:01:43 477

原创 UV工具安装配置使用教程

Astral公司推出的uv是一款集成化Python工具,旨在替代pip、virtualenv等传统工具链,统一管理环境、依赖和运行隔离。

2025-10-22 16:28:34 1171

原创 ModuleNotFoundError: No module named ‘pyairports‘

本文记录了在UV环境中部署Qwen2.5-7B大模型时遇到的"ModuleNotFoundError: No module named 'pyairports'"错误及解决方案。

2025-10-16 06:00:00 2373 3

原创 【深度解析】三大Transformer架构:Encoder-only、Decoder-only与Encoder-Decoder

NLP三大模型架构解析:Transformer衍生出的Encoder-only、Decoder-only和Encoder-Decoder三大主流架构各具特色。

2025-10-01 06:00:00 977

原创 大语言模型“记忆功能”探讨

大模型通过上下文窗口实现短期记忆功能,其工作原理基于自回归生成和注意力机制。然而,这种记忆具有严重局限性:容量限制导致信息丢失、注意力偏向开头和结尾内容、不同会话间完全隔离。

2025-10-01 06:00:00 483

原创 Function Call 原理详解

FunctionCalling是大语言模型(如GPT-3.5、GPT-4)的重要特性,允许模型智能调用外部工具或API,扩展其能力以完成实时数据获取、计算、数据库交互等任务。

2025-09-30 14:48:26 1025

原创 大模型分词器原理详解

大模型分词器是LLM的核心组件,负责将文本转换为模型可处理的数字Token。它通过子词分割算法(BPE、WordPiece、Unigram等)解决词汇无限性和未登录词问题,在字符与单词间取得平衡。

2025-09-30 14:33:10 921

原创 详解LLM中的 Prefill(预填充)计算阶段

本文介绍了大语言模型推理中的Prefill阶段及其与Decoding阶段的区别。

2025-09-26 15:51:27 1195

原创 使用 curl 调用 url 接口的完整示例与解析

本文介绍了使用curl工具调用接口的完整流程,重点解决本地文件需要转为URL的问题。

2025-09-25 09:52:37 813

原创 不同版本tensorflow推理报错解决方法

本文探讨了TensorFlow模型在不同CUDA和TensorFlow版本环境下的兼容性问题。

2025-09-19 16:11:56 973 1

原创 BGE-m3 和 BCE-Embedding 模型对比分析

BGE-m3和BCE-Embedding各有优势,BGE-m3在多语言支持(100+语言)、长文本处理(8192tokens窗口)和高密度检索(跨语言检索提升15%)方面表现突出;BCE-Embedding则在垂直领域优化、轻量化部署(110M参数,推理速度提升40%)和中文语义理解(成语/古汉语准确率更高)更具优势。

2025-09-12 14:47:45 210

原创 温度预测算法评价指标详解:从理论到实践的全面指南

本文系统介绍了7种温度预测模型的核心评价指标及其应用。主要包括MSE、RMSE、MAE、R²、MAPE、MedianAE和MaxError,从理论定义、数学公式到实际案例和Python实现进行了详细说明。

2025-09-12 14:12:54 999

原创 解决 Ubuntu 环境下 ffmpeg 安装依赖问题(FileNotFoundError: ffprobe 错误处理)

本文介绍了解决pydub音频处理时出现"FileNotFoundError:ffprobe"错误的多种解决方法。

2025-08-25 16:16:32 671

原创 《GPT-OSS 模型全解析:OpenAI 回归开源的 Mixture-of-Experts 之路》

OpenAI推出开源大模型GPT-OSS系列,包含120B和20B两个版本,采用Apache2.0协议。模型采用MoE架构和MXFP4量化技术,支持131K长上下文和高效推理。部署方式涵盖vLLM、Transformers等多种方案,提供兼容OpenAI的API接口。该系列在MMLU等测试中表现优异,为开发者提供强大的开源AI工具。

2025-08-20 14:45:02 1230

原创 检索系统评测指标详解:从理论到实践

本文系统介绍了信息检索系统中的关键评测指标。基础指标包括Recall@K(召回率)、Precision@K(精确率)、MRR(平均倒数排名)和NDCG@K(归一化折扣累积收益),分别衡量检索的全面性、准确性、速度和排序质量。高级指标涵盖DiversityScore(多样性分数)和CoverageScore(覆盖度分数),用于评估结果的丰富性和去重效果。

2025-08-07 06:00:00 1324

原创 RAG中的三大召回方式详解

本文介绍了三种RAG系统中常用的召回策略:1)BM25稀疏召回,基于词频统计的快速检索方法,适合文档匹配但缺乏语义理解;2)BCE向量召回,通过双塔模型实现语义搜索,效果更好但需要训练数据;3)关键词召回,基于规则匹配的简单方法,适合结构化场景但扩展性差。三种方法各具特点,可根据实际场景需求选择使用,其中BM25适合通用检索,BCE适合语义搜索,关键词召回则适用于规则明确的垂直领域。

2025-08-06 06:00:00 1351

原创 深入剖析 RAG 检索系统中的召回方式:BM25、向量召回、混合策略全解析

RAG(检索增强生成)系统通过结合信息检索与文本生成技术提升大模型回答的准确性。其中,召回作为第一步,直接影响系统性能。本文系统介绍了三种核心召回方式:基于关键词匹配的BM25稀疏召回、利用语义向量的BCE稠密召回,以及融合两者的混合召回。

2025-08-05 14:04:02 2360

原创 【RAG 检索排序详解】RRF vs Reranker:原理、区别与实战应用

RRF(Reciprocal Rank Fusion) 和 Reranker(重排序器)的区别、适用场景及如何结合使用。

2025-08-01 13:47:17 1828

原创 Qwen3 模型本地部署与应用

阿里推出第三代Qwen3大模型系列,包含8个参数规模从0.6B到235B的密集型和MoE模型,支持多模态输入和128K超长上下文。

2025-08-01 09:57:17 1227

原创 Ollama安装及使用Ollama部署大模型

Ollama是一个开源本地大语言模型运行平台,支持Docker部署和API调用。

2025-07-29 14:51:14 1365

原创 Git常用命令赏析

本文提供 Git 版本控制系统的全面使用指南,包含 26 个章节的核心内容: 基础操作、工作流核心、高级功能、性能优化、安全措施、工作流实践、疑难解决等。

2025-07-25 10:05:40 1243

原创 Linux 常用命令大全

本文整理了Linux系统常用命令大全,涵盖系统控制、信息查看、性能监控、文件操作、权限管理、用户配置、磁盘维护、软件安装等核心功能。

2025-07-24 09:51:38 823

原创 「实战指南」使用 Python 调用大模型(LLM)

本文介绍了四种Python调用大语言模型(LLM)API的方式:原生HTTP请求提供最高灵活性;封装式API调用便于维护和模型切换;OpenAI SDK方式稳定性好且功能丰富;传统OpenAI库简洁易用。每种方式各有特点:原生HTTP适合精确控制请求,封装式适合频繁切换模型,SDK适合官方API调用,传统库适合快速开发。开发者应根据项目需求(灵活性、维护性、功能丰富度等)选择合适方式,同时注意API安全和错误处理。

2025-07-22 14:29:46 3556

原创 Attu-Milvus向量数据库可视化工具

本文介绍了Milvus向量数据库的可视化管理工具Attu的两种安装方式:通过Docker容器启动(运行指定命令并设置相关参数)或下载桌面版程序安装。同时说明从Milvus v2.5.0版本开始内置的WebUI工具,可通过浏览器访问9091端口查看数据库详情、管理任务等。Attu作为开源工具,为Milvus提供了便捷的图形化管理界面,支持对集合、索引等核心功能的高效操作。

2025-07-19 15:19:08 1838

原创 基于LLM的问答对数据集构建和相关性评分

本文介绍了一套基于大语言模型(LLM)的电力领域智能问答系统,包含智能问答生成器和相关性评估系统两大核心模块。该系统针对电力行业特点设计,能高效处理变压器、继电保护、电网运行等专业领域知识。问答生成器采用批处理优化和多重验证机制,确保输出质量;相关性评估系统采用0-10分精细评分体系,为检索增强生成(RAG)提供支持。

2025-07-17 16:56:54 1036

原创 Termius:介绍+使用教程

Termius是一款支持全平台的SSH终端管理工具,适用于Windows/macOS/Linux/iOS/Android系统。它提供SSH/Mosh/Telnet连接、SFTP文件传输、多主题界面、服务器分组管理等功能,并支持端到端加密的跨设备同步。

2025-07-15 14:20:58 4024

原创 qpdf工具详解

qpdf是一个基于Qt框架的PDF处理工具,支持PDF合并/拆分、加密解密、线性化优化、结构检查和调试等功能。主要使用Qt框架和pdf.js技术实现跨平台PDF处理。支持Linux、macOS和Windows系统安装,提供命令行操作和C++/Python API接口。典型应用场景包括批量PDF处理、权限管理、网页优化和PDF结构分析。

2025-07-14 17:21:07 1674

原创 Git 提交历史查看与日志筛选全攻略

本文介绍了Git日志(gitlog)的实用操作指南,主要内容包括:基础用法展示提交历史、显示补丁(-p)与修改统计(--stat)、多样化输出格式(--pretty)设置、图形化分支(--graph)展示,以及多种过滤方式(时间、作者、关键词、路径等)。

2025-07-14 06:00:00 858

Cursor-1.5.11-x86-64.AppImage

Cursor-1.5.11-x86_64 版本安装包。

2025-11-03

linux-utils

linux 工具,可用于帮助提高工作效率。

2025-11-03

WeChatLinux

Linux系统上微信安装。

2025-07-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除