小女孩真可爱-CSDN博客

原创修改onnx模型最后节点输出名称

【代码】修改onnx模型最后节点输出名称。

2026-01-14 10:22:48 24

摘要：智能代理（Agent）是结合大语言模型与工具调用的AI系统，能够自主执行复杂任务。其核心组件包括：LLM（大脑）、工具集、记忆系统和执行框架。典型工作流程包括理解意图、工具调用、执行响应等步骤。Agent扩展了LLM能力边界，可实现实时信息查询、复杂计算、多步骤任务执行等功能。文章提供了三个实战案例：1）信息查询Agent结合百度搜索；2）搜索与计算工具结合的复合Agent；3）添加记忆库的对话Agent。这些案例展示了Agent在实际应用中的多样化能力。

2025-12-23 21:59:54 317

原创 langchain使用记录

新版本：from langchain_classic.prompts import PromptTemplate。老版本：from langchain.prompts import PromptTemplate。新版本的langchain很多函数都放到langchain_classic。

2025-12-05 15:27:49 135

原创大模型学习记录（八）---------RAG评估

本文介绍了基于PDF文档构建RAG(检索增强生成)系统并进行评估的完整流程。首先使用PyPDFLoader加载PDF文档，通过RecursiveCharacterTextSplitter分割文本，利用FAISS构建向量数据库。系统采用DeepSeek API作为LLM，实现问答功能。在评估环节，使用RAGAS框架对系统性能进行多维度评估，包括faithfulness、answer_relevancy、context_recall和context_precision等指标，并采用自定义的DeepSeek模型作

2025-12-03 11:42:11 305

原创大模型学习记录（七）---------RAG

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合信息检索和大语言模型生成能力的技术架构。它通过在生成回复前，先从外部知识库中检索与用户问题相关的文档片段，然后将这些检索到的信息与用户问题一起输入到语言模型中，生成更加准确、可靠和相关的回答。从提供的`r1_rag.py`代码中可以看出，RAG系统主要包含以下关键组件：1. **文档处理与分块**：将原始文档分割成更小的片段（chunks）2. **文本嵌入**：将文本转换为向量表示。

2025-12-02 17:45:53 671

原创大模型学习记录（六）-----提示词工程

本文介绍了提示工程（Prompt Engineering）的概念和应用，重点分析了零样本提示词和少样本提示词的区别。通过代码示例展示了两种提示方法在实际应用中的效果差异，结果表明少样本提示能获得更精确的回复。文章还介绍了链式思考（COT）技术，通过让AI展示推理过程来提升复杂问题的解决能力，并提供了相关代码实现和对比示例。这些技术能帮助用户更好地利用大型语言模型的能力，理解其局限性。

2025-11-24 21:09:18 197

原创大模型学习记录（五）-------调用大模型API接口

摘要：本文介绍了两种调用Deepseek API的方法。首先需要安装指定版本的PyTorch环境，并通过load_dotenv获取API密钥。方法一使用requests库发送POST请求，包含URL、headers和请求数据；方法二使用OpenAI Python库创建客户端并调用chat.completions接口。两种方法都需指定模型为"deepseek-chat"，设置用户消息和最大token数，最终输出API返回的内容。

2025-11-24 20:41:21 90

原创大模型学习记录（四）-----Transformer文本翻译

本文详细解析了一个基于Transformer架构的英中机器翻译模型的实现。该系统采用端到端的神经网络方案，通过自注意力机制和多头注意力技术实现高效的序列转换。模型由编码器、解码器和线性投影层三部分组成：编码器负责解析英文句子并提取上下文信息；解码器基于编码器输出逐步生成中文翻译；线性投影层将解码结果映射到目标词汇空间。关键技术包括位置编码、掩码机制和自注意力计算，确保模型能正确处理序列顺序和依赖关系。训练采用Adam优化器、学习率调度和梯度裁剪等技术，推理过程则通过自回归方式逐步生成翻译结果。实验表明该模型

2025-11-22 14:11:36 444

原创大模型学习记录（三）-------自定义搭建Transformer模型进行文本分类

摘要：本文深入解析Transformer架构在深度学习领域的核心优势，重点阐述其完全基于注意力机制的设计理念。文章详细介绍了Transformer的模块化架构（编码器-解码器）及其在不同任务中的灵活应用，特别强调了位置编码器在保留词序信息方面的关键作用。通过"我有一只猫"的实例，系统展示了文本数据预处理流程（分词、ID转换、长度统一、嵌入与位置编码）的完整实现。最后，文章提供了基于PyTorch的Transformer模型代码实现，包括模型训练、验证和预测的全流程，并展示了在情感分类任务

2025-11-22 13:53:30 86

原创大模型学习记录（二）------Transform文本分类

本文介绍了Transformer模型架构及其应用。Transformer通过自注意力机制解决了传统RNN的顺序处理困境，实现了并行计算和长距离依赖捕捉。作为现代大语言模型(GPT等)的基石，Transformer已广泛应用于NLP、计算机视觉、多模态等领域。文章还提供了基于Transformer的文本分类代码示例，使用预训练模型对酒店评论进行情感分析(好评/差评分类)，包括数据读取、模型训练和验证流程。该实现展示了如何利用HuggingFace的预训练Transformer模型进行迁移学习。

2025-11-20 21:56:52 195

原创大模型学习记录（一)大模型介绍

摘要：人工智能大模型正深刻改变人类生活。这类拥有超大规模参数的深度学习模型，通过TB级数据训练，展现出强大的理解、推理和生成能力。其发展经历了从符号主义到深度学习的演进，2017年Transformer架构的诞生成为关键转折点。目前大模型已广泛应用于内容创作、智能搜索、代码开发等领域，并朝着多模态融合、AI智能体等方向发展。未来趋势包括模型小型化、安全性提升及个性化定制，预示着一个更智能、更普惠的AI新时代即将到来。（150字）

2025-11-20 14:07:34 449

原创 ppocr空格训练推理记录

2.训练空格的话类别是6625，不训练空格类别是6624。但看字典txt文件发现只有6623个字符，这是因为在训练代码中use_space_char设为ture的时候，会把空格append 到最后一个类别（1.在rec的yaml文件里有一个use_space_char参数，设置true表示训练空格，设置false表示不训练空格。），6623+空格=6624，还有一个类别是啥？个人感觉是第0个类别是用于推理的时候CTCdecode去除重复字符。

2025-11-17 11:14:21 97

原创 LlamaIndex + 本地LLM报错

使用LlamaIndex + 本地LLM实现本地RAG的时候报上面的错误，一直以为是ollama端口占用报错。后面发现是llama3.1:8b太大报的错。但奇怪的是使用langchain+llm+faiss用的也是llama3.1:8b模型，跑起来没啥问题，才占了6G（显卡12G)

2025-11-08 11:37:48 215

原创 torchvision\transforms\v2\_transform.py“, line 55, in transform raise NotImplementedError

torchvision版本问题导致的，torchvision==0.20.1可以解决这个问题。

2025-11-04 10:43:41 127

原创 flash-attn安装（Windows和Linux系统）

本文提供了两个flash-attention预编译轮子(wheel)的下载地址：第一个是Linux版本(https://github.com/mjun0812/flash-attention-prebuild-wheels/releases?page=3)，包含较全的flash-attn版本和型号；第二个是Windows版本(https://github.com/kingbri1/flash-attention/releases)。下载时需注意与用户的Python版本、PyTorch的CUDA版本(非本地C

2025-10-23 10:02:48 783

原创 windows安装detectron2报错解决

在Windows系统安装detectron2时遇到错误，可通过更新setuptools解决。具体步骤：先执行pip install setuptools==75.8.0更新工具包，再运行pip install -e .完成安装。环境配置为：CUDA 12.6、PyTorch 2.8、Python 3.10。该方案有效解决了依赖版本不兼容问题。

2025-10-15 17:46:08 362 2

原创 GroudingDINO安装（第二版解决python3.10安装失败）

文章摘要：本文介绍了在Windows10系统下使用conda虚拟环境配置GroundingDINO目标检测模型的详细过程。环境配置包括Python3.10、CUDA12.4、torch2.4.0+cu124和torchvision0.19.0+cu124。安装过程中需修改setup.py文件编码为utf-8，并注意torch版本需大于2.1。文章提供了完整的测试代码，包含模型加载、图像预处理、预测和结果可视化功能，并针对可能出现的numpy版本冲突问题给出了解决方案（降低numpy和opencv-pytho

2025-09-17 17:24:23 1347 4

原创 Windows系统下安装Dify

本文介绍了在Windows系统下使用Docker安装Dify平台的完整流程。首先需要安装Docker和WSL2环境，然后从GitHub下载Dify源码。关键步骤包括：修改docker-compose.yaml文件中的镜像源为阿里云镜像，配置Docker使用国内多个镜像源加速下载，建议将Docker默认存储路径改为非C盘以避免空间不足。最后通过PowerShell或Docker终端执行启动命令，完成安装后即可通过本地地址访问Dify平台。整个流程重点解决了国内用户可能遇到的下载速度慢和连接失败问题。

2025-09-11 18:13:38 819

原创 MCP库安装20250911

本文介绍了使用uv工具管理Python MCP服务器的安装配置流程。首先创建conda虚拟环境并安装uv库，然后建立项目文件夹，通过uv命令初始化项目结构并创建虚拟环境，最后添加mcp库并验证安装。该方法为Python环境下MCP服务器的部署提供了系统化的解决方案。

2025-09-11 17:50:46 446

原创 ppocr检测模型前处理

resize完之后归一化（/255, 减均值，除方差）

2025-08-06 18:19:12 227

原创 onnx显示每一层的维度

【代码】onnx显示每一层的维度。

2025-07-30 14:01:51 263

原创 paddle模型推理（Python）

【代码】paddle模型推理（Python）

2025-07-29 10:12:46 259

原创 ppocr方向分类器记录

该代码实现了图像预处理流程：1)将输入图像高度缩放到48像素，宽度等比缩放；2)若缩放后宽度超过192则截断为192；3)对图像进行归一化处理（/255后减0.5除0.5）；4)当宽度不足192时进行右侧零填充。处理后的图像格式为(1,3,48,192)的float32张量，适用于分类模型输入。预处理保留了图像原始比例，同时确保输出尺寸统一。

2025-07-28 17:11:23 211

原创 paddlepaddle模型转onnx

本文介绍了使用paddle2onnx.export方法将PaddlePaddle模型转换为ONNX格式的经验。作者发现网上推荐的paddle.onnx.export和paddle2onnx.convert方法在Windows平台上存在问题，而直接使用paddle2onnx.export则可以完美解决。该方法需要指定模型文件(inference.pdmodel)和参数文件(inference.pdiparams)，并支持设置opset版本、自动升级opset、优化等参数。特别提醒需要使用export_mode

2025-07-22 11:03:17 409

golang爬虫第一版代码

这是一个demo实战的代码1

空空如也