用什么都重名-CSDN博客

原创深入解析：构建自己的Docker基础镜像

本文详细介绍了构建Docker基础镜像的方法：1）使用Dockerfile从现有镜像定制（推荐），提供Ubuntu和Alpine两种示例；2）通过docker commit命令从容器创建（适合快速测试）；3）使用debootstrap从头构建最小系统（适合需要完全控制）。

2025-12-29 09:04:10 761

原创 Dify 源码升级指南

本文详细介绍了Dify系统的升级流程。首先强调备份的重要性，提供了完整备份和选择性备份（包括docker-compose.yaml、.env文件和volumes数据）两种方案。升级步骤包括：1）获取最新代码；2）替换文件并恢复数据；3）启动服务。特别针对可能出现的数据库连接错误，给出了使用--profile postgresql参数的解决方案。

2025-12-19 15:11:15 702

原创 Python脚本打包成可执行文件完整指南：使用PyInstaller实现跨平台部署

本文介绍了使用PyInstaller将Python脚本打包为独立可执行文件的方法。针对需要部署到无Python环境服务器的场景，详细说明了从配置外部化、依赖管理到打包的全过程。

2025-12-17 10:56:04 824

原创 Dify服务部署指南

Dify是一个开源的大语言模型应用开发平台，支持快速构建AI应用。本文详细介绍了Dify的部署流程。

2025-12-09 16:13:00 1039

原创 ollama 预加载的模型未加载到GPU上问题方案详解

针对Ubuntu系统重启后Ollama服务无法自动使用GPU的问题，提出三种解决方案：1）优化启动脚本增加GPU驱动就绪检查；2）配置Systemd服务确保GPU初始化完成后再启动容器；3）调整Docker启动参数确保正确挂载GPU。

2025-12-08 11:35:18 839

原创 ollama 容器部署映射端口号修改

本文介绍了Ollama服务的端口查看与修改方法。默认情况下，Ollama监听11434端口，可通过netstat或ss命令确认。修改端口需编辑/etc/systemd/system/ollama.service文件，在[Service]部分添加OLLAMA_HOST环境变量（如0.0.0.0:11435）。修改后需重启服务并验证新端口是否生效。

2025-12-05 17:31:28 701

原创 Docker 镜像源配置指南

本文介绍了如何修改Docker镜像源以提升国内镜像拉取速度。

2025-12-02 13:21:23 726

原创设置 Ollama 容器自动重启和模型自动加载的方法

本文介绍了两种实现Docker容器自动启动的方法，以及针对模型加载问题，提出了自动加载脚本方案。

2025-11-24 10:33:13 727

原创 LaTeX公式完全指南：从入门到精通

LaTeX是一种专业的排版系统，专门用于科技文档和数学公式的排版。文章详细介绍了LaTeX的基本用法。

2025-11-06 06:00:00 1451

原创深入解析Milvus挂载卷：etcd, minio, milvus三大文件夹

Milvus核心文件夹解析：etcd、minio、milvus功能详解。Milvus数据库中的etcd、minio和milvus三个核心文件夹分别承担元数据存储、数据仓库和运行记录的关键角色。etcd作为"大脑"存储所有元数据，minio作为"仓库"保存实际向量数据，而milvus则记录系统运行日志和配置。

2025-11-05 07:00:00 1617

原创 LangGraph 实战（三）：添加记忆功能

本文介绍了如何为聊天机器人添加记忆功能，使其能够记住对话历史。通过使用LangGraph的MemorySaver类，实现了状态的保存和恢复。

2025-11-05 06:00:00 832

原创 LangGraph 实战（二）：添加工具使用能力

本文介绍了如何通过集成Tavily搜索API来增强聊天机器人的外部知识获取能力。修改后的聊天机器人能够自动识别需要外部信息的问题，调用搜索工具获取结果，并生成基于真实网络信息的回答。

2025-11-04 07:00:00 1513

原创 LangGraph 实战（一）：构建一个基础的聊天机器人

本文介绍了如何使用LangGraph构建一个基于DeepSeek大模型的简单聊天机器人。详细说明了构建过程：定义状态类、初始化DeepSeek模型、创建节点函数以及构建状态图结构。最后实现了一个支持流式响应的命令行交互程序，用户可以通过输入文字与机器人对话。该示例展示了LangGraph的核心概念和工作流程，为开发更复杂应用奠定了基础。

2025-11-04 06:00:00 697

原创 DeepSeek-OCR 深度解析

DeepSeek团队开源的DeepSeek-OCR模型创新性地将文本"画"成图像处理，实现高效信息压缩。该模型通过局部感知和全局压缩的双阶段设计，能将1000个文本Token压缩为100个视觉Token并保持97%的OCR精度，显著提升长文本处理效率。

2025-11-03 15:07:13 991

原创 CSDN 删除所上传的资源

本文介绍了删除CSDN已上传资源的具体方法。

2025-11-03 11:03:05 244

原创 linux 工具

本文介绍了在Linux和Windows系统中安装可用工具的步骤。

2025-11-03 09:46:38 166

原创 Docker vs Conda：环境管理的两大神器

本文深入对比Python开发中常用的环境管理工具Conda和Docker。

2025-10-31 17:54:54 1298

原创 LangGraph vs CrewAI vs OpenAI Swarm：三大AI框架

LangGraph是一款专为构建复杂AI工作流设计的开源框架，采用图结构建模组件关系，支持持久执行、人机协作和全面记忆管理等核心功能；CrewAI强调人机协作易用性，适合团队任务自动化；OpenAI Swarm则擅长大规模数据处理。

2025-10-31 16:59:48 557

原创 Transformer与CNN的本质区别：从局部感知到全局洞察的演进

CNN与Transformer的核心差异分析：CNN采用局部连接和权重共享，通过层级结构逐步扩大感受野，适用于图像处理等局部相关性强的任务；Transformer依靠自注意力机制直接建立全局关联，擅长处理序列数据中的长距离依赖。

2025-10-30 11:24:52 1210

原创 FastChat 框架部署 BGE 模型

本文介绍使用 FastChat 框架部署一个兼容 OpenAI API 接口的 BGE 模型的完整流程，以及使用 FastChat 框架进行部署的原因、优势。

2025-10-30 10:05:08 992

原创 curl: (77) error setting certificate verify locations

当使用curl命令时出现"(77) error setting certificate verify locations"报错，通常是由于Anaconda自带的curl使用了不完整的CA证书路径。

2025-10-22 17:01:43 573

原创 UV工具安装配置使用教程

Astral公司推出的uv是一款集成化Python工具，旨在替代pip、virtualenv等传统工具链，统一管理环境、依赖和运行隔离。

2025-10-22 16:28:34 1368

原创 ModuleNotFoundError: No module named ‘pyairports‘

本文记录了在UV环境中部署Qwen2.5-7B大模型时遇到的"ModuleNotFoundError: No module named 'pyairports'"错误及解决方案。

2025-10-16 06:00:00 3011 3

原创【深度解析】三大Transformer架构：Encoder-only、Decoder-only与Encoder-Decoder

NLP三大模型架构解析：Transformer衍生出的Encoder-only、Decoder-only和Encoder-Decoder三大主流架构各具特色。

2025-10-01 06:00:00 1177

原创大语言模型“记忆功能”探讨

大模型通过上下文窗口实现短期记忆功能，其工作原理基于自回归生成和注意力机制。然而，这种记忆具有严重局限性：容量限制导致信息丢失、注意力偏向开头和结尾内容、不同会话间完全隔离。

2025-10-01 06:00:00 551

原创 Function Call 原理详解

FunctionCalling是大语言模型（如GPT-3.5、GPT-4）的重要特性，允许模型智能调用外部工具或API，扩展其能力以完成实时数据获取、计算、数据库交互等任务。

2025-09-30 14:48:26 1386

原创大模型分词器原理详解

大模型分词器是LLM的核心组件，负责将文本转换为模型可处理的数字Token。它通过子词分割算法（BPE、WordPiece、Unigram等）解决词汇无限性和未登录词问题，在字符与单词间取得平衡。

2025-09-30 14:33:10 949

原创详解LLM中的 Prefill（预填充）计算阶段

本文介绍了大语言模型推理中的Prefill阶段及其与Decoding阶段的区别。

2025-09-26 15:51:27 1495

原创使用 curl 调用 url 接口的完整示例与解析

本文介绍了使用curl工具调用接口的完整流程，重点解决本地文件需要转为URL的问题。

2025-09-25 09:52:37 872

原创不同版本tensorflow推理报错解决方法

本文探讨了TensorFlow模型在不同CUDA和TensorFlow版本环境下的兼容性问题。

2025-09-19 16:11:56 1047 1

原创 BGE-m3 和 BCE-Embedding 模型对比分析

BGE-m3和BCE-Embedding各有优势，BGE-m3在多语言支持（100+语言）、长文本处理（8192tokens窗口）和高密度检索（跨语言检索提升15%）方面表现突出；BCE-Embedding则在垂直领域优化、轻量化部署（110M参数，推理速度提升40%）和中文语义理解（成语/古汉语准确率更高）更具优势。

2025-09-12 14:47:45 282

原创温度预测算法评价指标详解：从理论到实践的全面指南

本文系统介绍了7种温度预测模型的核心评价指标及其应用。主要包括MSE、RMSE、MAE、R²、MAPE、MedianAE和MaxError，从理论定义、数学公式到实际案例和Python实现进行了详细说明。

2025-09-12 14:12:54 1074

原创解决 Ubuntu 环境下 ffmpeg 安装依赖问题（FileNotFoundError: ffprobe 错误处理）

本文介绍了解决pydub音频处理时出现"FileNotFoundError:ffprobe"错误的多种解决方法。

2025-08-25 16:16:32 764

原创《GPT-OSS 模型全解析：OpenAI 回归开源的 Mixture-of-Experts 之路》

OpenAI推出开源大模型GPT-OSS系列，包含120B和20B两个版本，采用Apache2.0协议。模型采用MoE架构和MXFP4量化技术，支持131K长上下文和高效推理。部署方式涵盖vLLM、Transformers等多种方案，提供兼容OpenAI的API接口。该系列在MMLU等测试中表现优异，为开发者提供强大的开源AI工具。

2025-08-20 14:45:02 1312

原创检索系统评测指标详解：从理论到实践

本文系统介绍了信息检索系统中的关键评测指标。基础指标包括Recall@K（召回率）、Precision@K（精确率）、MRR（平均倒数排名）和NDCG@K（归一化折扣累积收益），分别衡量检索的全面性、准确性、速度和排序质量。高级指标涵盖DiversityScore（多样性分数）和CoverageScore（覆盖度分数），用于评估结果的丰富性和去重效果。

2025-08-07 06:00:00 1399

原创 RAG中的三大召回方式详解

本文介绍了三种RAG系统中常用的召回策略：1）BM25稀疏召回，基于词频统计的快速检索方法，适合文档匹配但缺乏语义理解；2）BCE向量召回，通过双塔模型实现语义搜索，效果更好但需要训练数据；3）关键词召回，基于规则匹配的简单方法，适合结构化场景但扩展性差。三种方法各具特点，可根据实际场景需求选择使用，其中BM25适合通用检索，BCE适合语义搜索，关键词召回则适用于规则明确的垂直领域。

2025-08-06 06:00:00 1419