洞明智能-CSDN博客

原创【项目实战】通过多模态+LangGraph实现PPT生成助手

PPT自动生成系统是基于LangGraph框架开发的工具，可将Markdown文档智能转换为专业PPT演示文稿。项目开源地址为https://github.com/BJSS-China/ppt_assistant。

2025-06-10 08:29:58 863

原创【学习总结】MCP协议之使用AgentSDK调用MCP-server

通过OpenAI SDK实现一个简单的Agent示例通过MLfow，可视化查看Agent的运行情况通过OpenAI SDK实现一个可以调用MCP的Agent示例MLflow 是一个开源平台，专为协助机器学习从业者和团队应对机器学习过程中的复杂性而设计。MLflow 关注机器学习项目的整个生命周期，确保每个阶段都易于管理、可追溯且可重现。官网：https://mlflow.org/docs/latest/通过OpenAI的Agent SDK，可以快速实现一个Agent。在Agent SDK。

2025-04-23 08:30:00 826

原创【学习总结】MCP协议之MCP-server(sse方式)实践

通过对mcp-server的改造，在实例化mcp-server的时候，配置相应的host、port，可以实现sse协议的部署。通过服务部署之后，其他用户可以在支持mcp的客户端中，通过mcp-server的url进行调用。

2025-04-22 08:30:00 1034

原创【学习总结】MCP协议之MCP简述

MCP是一套服务间通信协议，它通过统一的协议，解决了大模型与工具间繁琐的适配通信问题。MCP的构成包括：MCP Host、MCP Client、MCP Server、Local Data Source、Remote Data Source。封装MCP-server-weather服务时，需要在工具函数上添加@mcp.tool()装饰器。通过MCP协议，我们可以封装各种服务提供给Cursor、Cherry-Studio、甚至我们自己开发的Agent使用，从而使得LLM+Agent的功能更加强大。

2025-04-21 08:30:00 1039

原创【模型测试】基于OpenCompass实现Agent最为苛刻的基准评测：GAIA

import ostry:# 因为ModelScope的GAIA数据集读取存在问题，所以从huggingface读取rows = []})

2025-04-18 08:30:00 1302

原创【模型测试】基于OpenCompass构建Dify应用的自定义评测体系

基于OpenCompass的数据集深入研究，我们可以在数据集配置文件中通过配置reader_cfg、eval_cfg等参数，实现数据集的配置，从而实现数据集的样例个数的配置。我们可以根据业务场景的需求，构建自己的评价体系，评价数据集既可以选择开源已有的数据集，也可以创建契合自己业务场景的数据集。通过ai-eval-system的封装，我们可以对Dify平台上的应用进行评测，从而完成agent能力评估。

2025-04-17 08:30:00 855

原创【模型测试】大模型评测工具OpenCompass使用方法总结

由于使用连接下载tokenizer被墙；评测API时需要服务器支持LogProbs等问题源代码较为晦涩难懂，Readme文档不详细…导致评测工具的使用成本以及体验不佳，因此我们寻求一款国产的、源码可读性高，文档详细的评测工具：OpenCompass。全能力评估- 提供50+评测数据集，覆盖语言/知识/推理/创作等七大能力维度多模型支持- 支持HuggingFace/API等50+主流模型接入，包括LLaMA/GLM/ChatGPT等本土化优势- 内置文言文理解、法律伦理等中文特色评测维度。

2025-04-16 08:30:00 1084

原创【模型测试】大模型评测工具lm-evaluation-harness的使用方法总结

是由 EleutherAI 开发的开源工具，用于统一评估语言模型（如 GPT、LLaMA 等）在多样化任务中的性能。支持 200+ 评测任务，涵盖文本生成、逻辑推理、数学计算等领域。

2025-04-15 08:30:00 1167

原创【模型测试】基于OpenCompass的ai-eval-system在线评测系统

这是一个基于OpenCompass的模型评测系统，该系统提供了前端页面UI以方便用户自助开展评测工作。

2025-04-15 08:30:00 1178

原创【模型测试】大模型测评体系的构成

随着近期DeepsSeek大模型在AI领域的快速崛起，人工智能技术正在快速进化，在这场智能革命的浪潮中，一个关键命题愈发凸显：当大模型能力不断进化时，我们该如何建立与之匹配的评估体系。本文将以多篇论文内容作为基础，探讨大模型评价体系的重要性(Why)、评价什么(What)、在哪儿评价(Where)、如何评价(How)。

2025-04-14 08:30:00 728

原创【产品体验】DeepSeek的三种接入使用方法

DeepSeek作为国产顶尖大模型，在代码生成和逻辑推理方面表现优异。本文提供三种不同场景下的接入方案，满足从普通用户到开发者的不同需求。

2025-04-11 08:30:00 1610

原创【产品体验】豆包大模型实时语音本地化部署及功能体验

豆包大模型提供了实时语音功能，火山引擎官方提供了开源代码Demo，可以快速本地部署体验部署方法：注册火山引擎账号，开通RTC、TTS、ASR、火山方舟2.0模型服务在代码中配置AppId、RoomId、UserId、Token、TTSAppId、ASRAppId等参数Demo代码是基于Node.js实现，需要安装nodejs、yarn依赖安装完毕后，按照Readme中命令分别启动后端服务和前端页面即可体验感受：整体体验流畅，对话沟通非常流畅，AI的语音比较自然。

2025-04-10 16:28:03 2363

原创【模型部署】在AutoDL上使用Xinference部署模型

在【模型训练】在AutoDl上使用LLamaFactory进行模型训练中，我们介绍了如何通过SSH建立隧道，进而访问LLamaFactory进行模型训练。本章，我们将介绍如何通过Xinference进行模型推理服务的部署。AutoDL平台正常情况下，不对外提供Http或Https服务，所以需要通过SSH隧道建立连接。AutoDL平台安装引擎会失败，所以本例中改为使用vllm引擎。AutoDL平台默认没有安装Git-LFS，所以通过手动安装。

2025-01-10 10:59:25 1640

原创【模型训练】在AutoDL上使用LLamaFactory进行模型训练

在众多的GPU云平台中，AutoDL是我们常用的一个。它因为显卡可快速扩展、实例运行稳定、网络连接速度快，深受大家的喜爱。不过其端口映射略微复杂，所以本篇文章，我们将介绍在AutoDL平台上进行模型训练的过程。在LLamaFactory的},注意：以上file_name是数据集的绝对路径，需要根据实际情况修改。在AutoDL上使用LLamaFactory进行模型训练，需要进行端口映射，具体方法为使用SSH隧道。

2025-01-10 10:57:58 2183 2

原创【操作攻略】GPU云环境的使用分享

同上，对于体积小的数据，可以直接使用图示中的上传文件功能。对于体积大的情况，需要使用趋动云提供的sftp上传上传方式。趋动云最近更新增加了导出数据/模型的功能，相较于上述操作更为简便，篇幅原因不做详细说明，感兴趣的同学可以查看。对于体积小的框架(例如：YOLO只有56M)，可以使用pip命令安装，具体方法同阿里云的操作说明。训练完毕后，会在训练脚本同一目录下生成runs目录，里面包含训练的日志，以及训练的模型。因为上传后的文件是只读的，不能使用unzip解压，所以我们在本地解压好之后进行上传。

2024-11-19 10:12:11 1455 1

原创【重拾数学知识】矢量的点乘和叉乘

点乘（又称内积）是两个矢量的代数运算，结果是一个标量。对于两个矢量Aa1a2a3Aa1a2a3和Bb1b2b3Bb1b2b3A⋅Ba1b1a2b2a3b3A⋅Ba1b1a2b2a3b3叉乘（又称外积）是两个矢量的运算，结果是一个新的矢量，且与原来的两个矢量都垂直。对于两个矢量Aa1a2a3Aa1a2a3和。

2024-11-19 10:04:47 1627

原创【产品体验】使用Coze平台开发一个看图配诗的智能体

AI Agent（AI代理）是一种能够感知外部环境、进行自动决策和执行动作的智能实体。随着大模型技术的快速迭代，Agent的能力也逐步增强，目前部分场景已经开始有相应的落地，例如：我们曾借助LinkAI平台搭建了一个微信公众号智能客服。本章，我们将借助最近国内比较火热的Coze(扣子)平台构建一个智能体。扣子是新一代AI 应用开发平台。无论你是否有编程基础，都可以在扣子上快速搭建基于大模型的各类智能体，并将智能体发布到各个社交平台、通讯软件或部署到网站等其他渠道。

2024-11-14 11:07:41 1692

原创【产品体验】使用LinkAI部署微信公众号智能客服

在当今数字化时代，智能客服系统已经成为企业与客户之间沟通的重要桥梁。通过使用LinkAI搭建一个微信公众号的智能客服，不仅可以提升客户服务效率，还可以7*24小时在线支持。本文将详细介绍使用LinkAI创建智能客服的效果、部署方法以及相关内容。

2024-11-14 11:05:42 874

原创【课程总结】day34：多模态大模型之ViT模型、CLIP模型论文阅读理解

前言在【课程总结】day31：多模态大模型初步了解一文中，我们对多模态大模型的基本原理有了初步了解，本章内容将通过论文阅读理解，更进一步理解多模态大模型中所涉及的 Vit 架构、Transformer在视觉应用的理念以及 Clip图像与文本匹配的应用。ViT 模型论文阅读理解多模态大模型中所涉及的最为经典的模型就是 ViT，所以我们先了解该论文的核心要点。论文标题：An Image Is Worth 16x16 Words: Transformers For Image Recognition At

2024-11-06 11:41:16 1480 1

原创【课程总结】day33：文生图StableDiffusion模型初步了解以及部署体验

在【课程总结】Day16：对抗生成网络GAN中，我们曾接触了解了对抗生成GAN网络，本章将学习了解另外一种文生图的模型Diffusion扩展模型，并尝试搭建和试用stable Diffusion。文生图（Text-to-Image）是一种人工智能技术，可以根据输入的文本描述生成相应的图像。其中近期比较火热的模型有Stable Diffusion，它基于扩散模型，将文本描述转化为图像。

2024-11-06 11:40:34 739

原创使用Xinference部署向量化模型

在【课程总结】day24（下）：大模型部署调用(vLLM+LangChain)一文中，我们曾学习到大模型需要借助 vLLM 进行部署。本章我们将介绍另外一个较火的部署组件Xinference。Xinference 是一个高效的推理引擎，旨在加速深度学习模型的推理过程。它支持多种模型格式，并提供灵活的部署选项，适用于各种应用场景。

2024-11-01 12:34:28 2128

原创【项目实战】通过LLaMaFactory+Qwen2-VL-2B微调一个多模态医疗大模型

随着多模态大模型的发展，其不仅限于文字处理，更能够在图像、视频、音频方面进行识别与理解。医疗领域中，医生们往往需要对各种医学图像进行处理，以辅助诊断和治疗。如果将多模态大模型与图像诊断相结合，那么这会极大地提升诊断效率。

2024-10-28 10:45:31 3721

原创【课程总结】day32：多模态大模型Qwen2的深入了解

本章我们将深入了解Qwen2-VL并使用多模态对于视频的处理能力。

2024-10-23 10:16:34 806

原创【课程总结】day31：多模态大模型初步了解

随着2024年5月14日GPT-4o的发布，多模态大模型逐渐成为行业热点，国内各大厂商阿里、百度、智谱也相继发布了自己的多模态大模型。本章内容，我们将从多模态的体验感受开始，逐步了解多模态大模型的架构组成、训练数据构成，最后搭建一个多模态大模型。多模态大模型是一种能够处理和理解多种数据类型（模态）的人工智能模型。这些模态通常包括文本、图像、音频和视频等。量化是将高精度浮点数表示（如32位浮点数）转换为低精度表示（如16位、8位或更低位数）的过程。这种转换可以显著减少模型的内存占用和计算复杂度。

2024-10-16 12:41:51 1330

原创【课程总结】day30：大模型之Agent的初步了解

电影《钢铁侠》中的智能助手J.A.R.V.I.S.是一位得力的助手，它不但有强大的理解能力，而且还具备执行行动的能力。随着技术的不断进步，类似于贾维斯的Agent正在逐步从银幕走进现实。本文将探讨Agent的产生背景，并结合一些代码示例理解Agent。第一步# 定义一个获取当前时间的函数 def get_datetime() - > str : """跟时期或时间查询相关的问题，请调用此方法注意：- 此方法没有入参- 返参是字符串形式的日期""" # 调用该函数 get_datetime()

2024-10-09 10:18:12 1151

原创【课程总结】day29：大模型之深入了解Retrievers解析器

在上一章【课程总结】day28：大模型之深入探索RAG流程中，我们对RAG流程中文档读取(LOAD)->文档切分(SPLIT)->向量化(EMBED)->存储(STORE)进行了深入了解，本章将接着深入了解解析(Retrieval)的使用简介：在 RAG（Retrieval-Augmented Generation）流程中，Retrieval（检索）是关键环节，其主要目标是从大量文档或知识库中提取与用户查询相关的信息。目的。

2024-09-29 11:04:15 1204

原创【课程总结】day28：大模型之深入探索RAG流程

在上一章【课程总结】day27：大模型之初识RAG中，我们初步了解了RAG的基本概念和原理，并通过代码实践了一个简单的RAG流程。本章我们将基于RAG的基本流程，深入了解文档读取(LOAD)文档切分(SPLIT)向量化(EMBED)和存储(STORE)的每个环节，并结合代码进行常见场景的实践。

2024-08-29 20:25:23 1311

原创【课程总结】day27：大模型之初识RAG

通过前几章的学习，我们已经掌握连接一个第三方大模型，使用LangChain与大模型建立交互，并且通过Prompt进行提问，得到相应的回答。本章我们将开始了解RAG（检索增强生成）技术，了解RAG的技术原理以及基本使用方法。

2024-08-21 14:08:31 962

原创【课程总结】day26：大模型应用开发之Prompt进阶使用

在上一章【课程总结】day25：大模型应用之Prompt的初步了解的学习中，我们了解了大模型上层开发中Prompt的基本流程。

2024-08-21 14:05:44 1074

原创【课程总结】day25：大模型应用开发之Prompt初步了解

在上一章，我们主要了解了什么是LangChain以及基本的部署方式，本章将结合LangChain框架，了解大模型的应用方式：即Prompt。

2024-08-21 14:03:40 963

原创【课程总结】day24（下）：大模型部署调用(vLLM+LangChain)

在上一章【课程总结】day24（上）：大模型三阶段训练方法(LLaMa Factory)内容中主要了解一个大模型的训练过程，无论是第三方的大模型还是自研的大模型，都需要部署到服务端，提供对应API接口供上层应用使用。所以，本章将主要了解vLLm + langchain的基本使用方法。

2024-08-15 19:23:14 3886

原创【课程总结】day24（上）：大模型三阶段训练方法(LLaMa Factory)

本章我们将通过 LLaMA-Factory 具体实践大模型训练的三个阶段，包括：预训练、监督微调和偏好纠正。

2024-08-15 19:22:02 2692 5

原创【课程总结】day23：大模型训练策略（BERT模型与GLM模型）

在前两章的学习中，我们了解到大模型的训练过程，其中Base model(底座大模型)的训练采用了挖空填空的策略。本章我们将结合BERT和GLM两个模型的论文，深入了解在预训练时两者的具体训练策略。

2024-08-15 19:19:53 1079

原创【课程总结】day22：Qwen模型的体验

在上一章【课程总结】day21（下）：大模型的三大架构及T5体验中，我们体验了Encoder-Decoder架构的T5模型。本章内容，我们将以Decoder-Only架构的Qwen模型入手，了解Qwen模型结构、聊天模板的概念以及通过大模型进行翻译、信息抽取等任务的尝试。

2024-08-15 19:19:18 1337

原创【课程总结】day21（下）：大模型的三大架构及T5体验

在前两篇学习中【课程总结】day19（中）：Transformer架构及注意力机制了解，我们初步了解大模型的公共底层架构的构成，同时借助对的代码深入了解(【课程总结】day20：Transformer源码深入理解之训练过程)，初步掌握了的训练过程。本篇我们将对大模型的训练阶段进行初步了解，同时部署一个T5模型进行试用体验。

2024-08-15 19:17:54 1297

原创【课程总结】day21（上）：Transformer源码深入理解之预测过程

在上一章【课程总结】day20：Transformer源码深入理解-训练过程总结中，我们对Transformer的训练过程进行了详细的分析，本章将介绍Transformer的预测过程。

2024-08-15 19:16:50 945

原创【课程总结】day20：Transformer源码深入理解之训练过程

在上一章【课程总结】day19（下）：Transformer源码深入理解总结中，我们对Transformer架构以及初始化部分做了梳理，本章我们将对Transformer训练过程进行代码分析理解。

2024-08-15 19:15:45 1415

原创【课程总结】day19（下）：Transformer源码深入理解之构建模型流程

在上一章【课程总结】day19（下）：Transformer架构及注意力机制了解总结中，我们对Transformer架构以及注意力机制有了初步了解，本章将结合中的源码，对Transformer的架构进行深入理解。

2024-08-03 21:11:48 991

原创【课程总结】day19（中）：Transformer架构及注意力机制了解

本章内容，我们将从注意力的基础概念入手，结合Transformer架构，由宏观理解其运行流程，然后逐步深入了解多头注意力、多头掩码注意力、融合注意力等概念及作用。

2024-08-03 21:10:23 1162

原创【课程总结】day19（上）：大模型简介

终于，我们的课程将要进入到当前最为火热的大模型部分。本章内容，我们将开始了解大模型，其中的内容包含大模型的发展历史、大模型的特点、大模型底层架构Transformer的简单了解以及最后对于人工智能的思考。大模型通常指的是具有大量参数（具有数亿到数千亿参数的深度学习模型）的深度学习模型，这些模型在处理复杂任务时展现出显著的性能提升。

2024-08-03 21:08:42 1289

空空如也

空空如也