大模型应用开发进阶
文章平均质量分 84
本专栏聚焦大模型技术落地与工程实践,面向有一定基础的开发者。我们将深入探讨提示工程设计技巧、高级Agent架构设计、多模态系统集成、性能调优与私有化部署等实战议题。通过案例拆解与源码分析,跨越从理论到产业应用的鸿沟,掌握构建高可用AI应用的核心能力,突破大模型开发的深层技术边界。
谷哥的小弟
历任研发工程师,技术组长,项目经理;曾于2016年、2020年两度荣获CSDN年度十大博客之星。出版《MyBatis核心技术全解与项目实战》、《大模型应用开发实践 基于Spring AI+DeepSeek实现》以及《Spring AI大模型应用开发》等多部技术图书。
十载寒冰,难凉热血;多年过去,历经变迁,物是人非。
然而,对于技术的探索和追求从未停歇。
坚持原创,热衷分享,初心未改,继往开来!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型知识库Cubox
Cubox是一款专注于碎片化信息管理的AI知识工具,通过高效剪藏、沉浸阅读和智能解析帮助用户解决"收藏即遗忘"痛点。其核心功能包括全能剪藏系统(支持网页/微信/PDF等多源收藏)、AI深度解析(自动摘要/问答/高亮)和知识网络构建(智能分类/全文检索)。相比Notion等综合工具,Cubox更侧重被动收集与阅读优化;与Obsidian相比则强调云端便捷性而非本地深度管理。该工具特别适合知识工作者、学生等需要处理碎片信息的用户,但需注意建立分类体系、合理使用AI功能及数据安全。原创 2026-05-15 14:31:08 · 126 阅读 · 0 评论 -
大模型知识库Obsidian
Obsidian是一款本地优先、隐私至上的知识管理工具,以Markdown纯文本存储为核心,支持双向链接构建知识网络。其开放插件生态(2000+插件)和高度自定义AI集成能力(支持云端API与本地部署模型)使其区别于Notion等云端工具,特别适合注重数据隐私的专业人士。Obsidian适用于个人知识管理、学术研究、专业工作等场景,但需注意知识结构规划、数据备份、插件管理和本地AI部署等技术要点。该工具强调用户对数据的完全掌控,避免平台锁定风险,是构建"第二大脑"的理想选择。原创 2026-05-15 14:26:04 · 139 阅读 · 0 评论 -
大模型知识库NotebookLM
NotebookLM是Google Labs基于Gemini大模型开发的AI驱动研究助手,官方定位为“您的专属AI研究伙伴”,其核心设计理念以“源文本驱动”为根基,通过严格锚定用户上传资料的方式,彻底解决通用AI的“幻觉”问题,同时凭借独特的“音频概览”功能,将文本内容转化为自然对话式的AI播客,为知识消化与传播提供全新途径。这款工具从根本上重新定义了AI时代知识管理的范式,特别适合需要严谨研究与高效内容转化的学生、研究人员和知识工作者。官方地址为:notebooklm.google.com;原创 2026-05-15 14:19:13 · 866 阅读 · 0 评论 -
大模型知识库Heptabase
Heptabase是一款可视化知识管理平台,通过"卡片-白板-标签"三层结构打破传统线性笔记局限。核心功能包括:卡片作为知识原子支持多种内容格式;白板提供无限画布构建思维地图;标签与双向链接强化知识关联;支持PDF标注、AI辅助和多平台同步。相比Notion等工具,Heptabase更注重可视化思维表达,适合复杂知识体系构建。应用场景涵盖个人学习、团队协作和创意工作,但需注意知识结构规划、卡片粒度控制和定期维护。该工具特别适合学生、研究人员等需要深度思考的用户群体。原创 2026-05-15 14:15:29 · 185 阅读 · 0 评论 -
大模型知识库Notion
Notion是一款集知识库、任务管理与协作为一体的全能生产力平台。其核心能力包括无限层级页面嵌套、多模态内容支持、双向链接和数据库功能,可构建结构化知识体系。与传统知识库相比,Notion更灵活,支持网状组织方式和个性化定制,适合个人知识管理、团队Wiki及企业文档管理。使用时需注意知识结构设计、定期维护和权限管理。Notion通过"块+数据库+AI"的创新组合,实现了知识的高效组织与智能应用,成为现代知识管理的优选工具。原创 2026-05-13 23:00:00 · 220 阅读 · 0 评论 -
大模型知识库IMA
腾讯混元大模型团队推出的IMA智能工作台(https://ima.qq.com/)是一款AI驱动的知识管理工具,支持多端同步,提供“搜-读-写”一体化解决方案。其三层技术架构融合大模型、向量语义与知识图谱技术,支持多模态内容解析与30GB免费存储,通过RAG技术减少AI幻觉。核心功能包括智能问答、多格式文档处理、团队协作及知识图谱生成,差异化优势在于动态关联私有知识与公共数据,提升专业场景精准度。开放API支持生态扩展,适用于教育、职场、科研等领域,兼顾效率与数据安全。原创 2026-05-13 22:15:00 · 250 阅读 · 0 评论 -
VBA在AI时代仍然不可完全替代
VBA(Visual Basic for Applications)是微软Office套件的嵌入式编程语言,深度集成于Excel、Word等应用,实现办公自动化、文档操控和跨组件交互。其技术架构基于COM接口,支持事件驱动编程,具备数据处理、自定义功能扩展等核心能力。在AI时代,VBA仍不可替代,因其能实现底层操作且不依赖网络环境。开发需遵循变量声明、代码结构等规范,并注意文件格式、安全策略等限制。性能优化策略包括关闭屏幕刷新、使用数组替代循环等。VBA在遗留系统维护和轻量自动化场景中保持核心价值。原创 2026-05-11 13:49:02 · 114 阅读 · 0 评论 -
Coze低代码工作流集成文本插件TextIn
TextIn是合合信息旗下的一站式智能文档处理平台,提供图像识别、文件转换和大模型加速等服务。其核心技术包括99.7%高精度文本识别引擎、20种格式文档解析引擎和智能抽取引擎,支持50+语言识别和复杂表格处理。平台提供公有云API、SDK和私有化部署方案,适配金融、政务等行业需求,并与Coze低代码平台深度集成,实现文档驱动的自动化流程。使用限制包括QPS配额和文件大小限制,优化建议包括预处理图像和选择合适部署方案。该平台已应用于古籍数字化、跨境电商等多场景,助力企业实现智能化文档处理。原创 2026-05-11 00:30:00 · 172 阅读 · 0 评论 -
Coze低代码工作流使用限制
本文介绍了Coze低代码工作流的使用限制,主要包括三方面:1)超时时间限制,不同节点类型有3分钟至10分钟不等的默认超时设置,工作流整体同步运行限10分钟、异步24小时;2)QPS限制,单个节点最高3000QPS,工作流维度根据版本不同为200-500QPS;3)其他限制包括节点数量(最多1000个)、请求大小(20MB上限)、并发数等。开发者需注意这些限制以避免运行异常,建议参考官方文档合理设计工作流。原创 2026-05-10 11:35:37 · 239 阅读 · 0 评论 -
Coze低代码智能体发布主要方式及其差别
文章摘要: 本文探讨了Coze低代码平台在不同渠道分发知识库助手的方案对比,重点解决30人团队内部使用的权限控制需求。飞书凭借原生权限体系成为最优选,支持一键发布与精细管控;微信公众号适合公开内容分发;微信小程序和企业微信需额外开发实现访问控制,成本较高。核心结论:飞书是唯一能原生满足「仅限内部使用」的渠道,配置简单且零开发成本,而微信生态的解决方案均存在权限或开发门槛问题。选择时应根据团队协作工具和技术能力权衡,优先考虑飞书集成。原创 2026-05-04 16:21:35 · 121 阅读 · 0 评论 -
Coze低代码模式和Vibe Coding的区别
Coze国内版与海外版最核心的区别在于,它们是两套完全独立的体系,从底层大模型、产品生态到收费模式都截然不同。国内版(coze.cn)根植于字节跳动生态,底层主要依赖其自研的豆包(云雀)大模型,同时也接入了Kimi、百川、DeepSeek、通义千问等国产模型。而海外版(coze.com)的技术底座则更加国际化,集成了包括 GPT-4o、Claude、Gemini 等在内的多款海外顶尖大模型,用户拥有更丰富的模型选择空间。此外,两个版本的插件和功能也存在差异,例如国内的Doc Maker插件可能只支持原创 2026-05-04 00:15:00 · 529 阅读 · 0 评论 -
大模型Skill开发
本文对比了提示词(Prompt)与技能(Skills)的适用场景与差异。提示词适合一次性简单任务,灵活但维护成本高;Skills则是结构化封装的可复用模块,适用于复杂、重复性任务,能提高执行稳定性和团队协作效率。文章指出Skills目前处于测试阶段,主要面向企业级用户,并提供了三步开发指南:编写工程级提示词、通过ChatGPT转化为Skill、打包分发。两者并非替代关系,而是互补方案——临时需求用提示词,标准化流程用Skills。原创 2026-05-02 15:27:17 · 418 阅读 · 0 评论 -
利用Trae实现VBA编程
VBA(Visual Basic for Applications)是微软Office内置的编程语言,让Word、Excel等应用程序可以自动化执行任务。通过编写“宏”,可把一系列手动操作变成一键完成,极大提升办公效率。例如,在Word中快速统一标题格式,在Excel里自动计算并生成月度报表。VBA语法易学,基于经典Basic语言,能直接操控软件里的文档、工作表、图表等对象。即使不懂编程,也可先录制操作获得代码雏形,再按需调整。它不仅支持自动化,还能创建交互式用户窗体、连接外部数据库扩展功能。原创 2026-05-02 12:09:25 · 97 阅读 · 0 评论 -
图文详解Trae配置Java开发环境
本文介绍了Trae开发工具的安装配置流程:首先从官网下载安装Trae,然后安装Java开发所需的Extension Pack for Java和Spring Boot Extension Pack插件。关键步骤包括修改settings.json配置文件,需指定JDK路径、Maven可执行文件路径和用户设置文件路径。所有操作均配有图示说明,并强调要替换为实际电脑路径。原创 2026-02-01 15:40:09 · 5336 阅读 · 0 评论 -
大模型应用开发工程化实践:将大模型返回的Markdown内容渲染为HTML
本文介绍了在前端页面中将大模型返回的Markdown内容渲染为HTML显示的解决方案。针对现代Web应用中大模型响应以Markdown格式输出但前端需要HTML展示的痛点,推荐使用客户端渲染方案,通过轻量级JavaScript库marked.js实现实时转换。文章详细说明了实施步骤:引入marked.js库、准备HTML结构、编写JS渲染逻辑、添加CSS美化以及测试调试方法。该方案适用于HTML+Thymeleaf或纯HTML技术栈,支持动态内容实时渲染,具有灵活高效的特点,同时提供了处理异步加载内容的Mu原创 2026-01-30 13:59:46 · 335 阅读 · 0 评论 -
图片上传自动人脸打码:微信小程序隐私保护实践
本文介绍了一种在微信小程序中实现本地化人脸识别与打码的技术方案。该方案通过微信原生API选择图片,利用Canvas 2D进行图像处理,实现了完全在用户设备端完成的人脸检测与马赛克处理。核心功能包括自动人脸检测、实时打码处理、多人脸支持等,所有处理均在本地完成,既保障了用户隐私又提升了使用体验。文章详细解析了Canvas初始化、图片处理流程等关键技术实现,并提供了完整的功能演示效果图。该方案适用于需要保护用户隐私的图片分享场景,具有无需云端处理、数据安全可靠等特点。原创 2026-01-27 14:01:08 · 390 阅读 · 0 评论 -
IDEA接入智谱GLM-4.7及其配置
智谱AI发布新一代开源大模型GLM-4.7,在编程、推理和工具调用能力上实现突破。该模型通过"交错式思考"等技术优化复杂任务处理,支持API调用和开源下载。开发者可在IDEA中安装Continue插件并配置GLM-4.7(需修改config.json文件),通过API Key接入使用。注意apiBase需填写智谱官方提供的两种有效地址之一。原创 2026-01-12 17:18:13 · 4890 阅读 · 0 评论 -
File System MCP服务器安装以及客户端连接配置
本文介绍了File System MCP服务器的功能与安装配置方法。该服务器作为AI助手与文件系统间的安全中间层,通过MCP协议提供受限的文件操作权限。安装需执行npm全局安装命令,启动时需指定工作目录路径。文中详细说明了Spring AI项目连接服务器的配置方式,并强调需预先设置文件夹访问权限以确保正常使用。通过这套系统,AI助手可在安全边界内处理文件任务,扩展其工具调用能力。原创 2026-01-12 16:37:09 · 1263 阅读 · 0 评论 -
SQLite MCP服务器安装以及客户端连接配置
SQLite MCP Server是一款基于MCP协议的中间件,用于在AI助手与SQLite数据库之间建立标准化交互桥梁。文章介绍了其核心功能、多种实现版本(如Node.js/Python/Rust)及加密数据库访问变体。详细说明了安装步骤(pip安装命令)、Navicat连接方式及Spring AI项目的客户端配置方法,强调其通过自然语言指令实现高效数据库操作的优势。原创 2026-01-12 16:13:22 · 273 阅读 · 0 评论 -
Brave Search MCP服务器安装以及客户端连接配置
Brave Search是一款注重隐私保护的独立搜索引擎,由Brave公司开发。它基于自有网络索引(覆盖92%查询),不追踪用户数据,提供网页端和浏览器集成服务。特色功能包括可自定义排序的Goggles和AI摘要工具Summarizer,月查询量达8.43亿次。安装需Node.js环境,通过npm全局安装服务端组件,配置API密钥后启动。Spring AI项目可通过MCP客户端连接,需设置超时、命令行参数及环境变量(含API密钥)。官方网址:https://search.brave.com/原创 2026-01-11 11:09:30 · 1416 阅读 · 0 评论
分享