国产开源大模型开发实战手册
文章平均质量分 97
专注于GLM、Qwen、DeepSeek等国产开源大模型的部署实践、推理优化、训练微调,通过实战案例和代码解析,助力开发者从入门到进阶,解锁高效开发与创新应用。
寻道AI小兵
10年+互联网架构师,聚焦AI大模型开发实战,分享前沿技术,解锁AI新技能,共探智能未来!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Kimi-VL 专家混合视觉语言模型(五):基于LLaMA-Factory 微调实战指南
随着大型语言模型(LLM)的不断发展,越来越多的开发者和研究者开始关注如何针对特定任务或领域对这些模型进行微调。LLaMA-Factory 作为一个高效、统一的微调框架,支持对 100 多种语言模型和视觉语言模型(VLM)进行微调。本文将详细介绍如何基于 LLaMA-Factory 微调 Kimi-VL 模型,包括环境准备、数据集整理、微调配置以及训练过程等关键步骤,帮助读者快速上手并实现对 Kimi-VL 模型的定制化微调。原创 2025-05-29 08:00:00 · 2072 阅读 · 2 评论 -
Kimi-VL 专家混合视觉语言模型(四):基于 Kimi-VL 打造多模态智能对话助手
随着人工智能技术的飞速发展,对话助手在众多领域发挥着越来越重要的作用。Kimi-VL 作为一个强大的多模态对话模型,为我们搭建智能对话助手提供了有力的支持。本文将详细介绍基于 Kimi-VL 构建对话助手的全过程,包括环境准备、模型下载、应用搭建与部署等关键步骤,帮助读者快速上手并打造属于自己的智能对话助手。原创 2025-05-28 15:26:56 · 1509 阅读 · 3 评论 -
Kimi-VL 专家混合视觉语言模型(三):基于vLLM 部署推理实战指南
本文介绍了Kimi-VL视觉语言模型基于vLLM框架的推理部署实践。vLLM通过PagedAttention机制有效提升大模型推理效率,支持多GPU并行计算。文章详细展示了vLLM的安装步骤(pip install vllm)和本地离线部署代码示例,包括模型加载、图像处理及推理生成过程。示例代码演示了如何加载Kimi-VL-A3B-Instruct模型,处理图像输入,并生成多模态响应。输出日志显示了模型初始化、配置加载等关键步骤,验证了vLLM在保障数据安全性和离线环境可用性方面的优势。该方案适用于金融、医原创 2025-05-28 08:00:00 · 1412 阅读 · 43 评论 -
Kimi-VL 专家混合视觉语言模型(二):基于Transformers推理实践大全
为了帮助大家快速上手并实际使用 Kimi-VL 模型,本文将聚焦于如何利用 Hugging Face Transformers 库进行推理实践。通过详细的环境准备和代码示例,大家将能够轻松地在自己的项目中集成 Kimi-VL,体验其强大的多模态处理能力。原创 2025-05-27 16:00:30 · 1369 阅读 · 5 评论 -
Kimi-VL 专家混合视觉语言模型(一):多模态全景概览
Kimi-VL是由月之暗面开源的一款轻量级多模态视觉语言模型,采用专家混合架构(MoE)和MoonViT视觉编码器,支持图像、视频、文档等多种输入形式。该模型在128K长上下文处理、复杂推理任务中表现优异,超越GPT-4o等主流模型。技术架构包含视觉编码器、MLP投影层和MoE语言解码器,通过多阶段训练(预训练、联合训练、强化学习等)优化性能。Kimi-VL提供两个版本:A3B-Instruct(高效推理)和A3B-Thinking(复杂推理),适用于智能客服、教育辅导、医疗辅助等场景。相关资源已在GitH原创 2025-05-27 07:59:10 · 1271 阅读 · 50 评论 -
AI大模型探索之路-应用篇14:认识国产开源大模型GLM
在人工智能的浩瀚宇宙中,开源大模型如同璀璨星辰,引领着技术创新与应用探索的方向。国际领域的OpenAI无疑闪耀着夺目的光芒,但国内厂商亦步亦趋,逐渐展露头角。今天,我们将聚焦于国内主流的大模型,探寻它们的技术脉络与应用潜力,并特别解析智谱AI研发的GLM大模型系列,见证中国在全球AI舞台上的坚实步伐。原创 2024-04-17 08:36:46 · 6843 阅读 · 62 评论 -
AI大模型探索之路-应用篇15:GLM大模型-ChatGLM3-6B私有化本地部署
ChatGLM3-6B 是 OpenAI 推出的一款强大的自然语言处理模型,它在前两代模型的基础上进行了优化和改进,具有更高的性能和更广泛的应用场景。本文将从技术角度对 ChatGLM3-6B 进行详细介绍,包括其特点、资源评估、购买云服务器、git拉取GLM、pip安装依赖、运行测试以及本地部署安装等方面的内容。希望通过本文的介绍,能够帮助大家更好地理解和使用 ChatGLM3-6B 模型。原创 2024-04-18 08:01:45 · 6635 阅读 · 78 评论 -
AI大模型探索之路-应用篇16:GLM大模型-ChatGLM3 API开发实践
本章节旨在深入探索ChatGLM3所提供的丰富API接口,不仅覆盖GLM特有的代码风格API开发实践,还包括遵循OpenAI风格的API开发方式。我们将通过具体的操作步骤和实际案例,详细阐述如何利用核心工具Function Call来扩展模型功能,以及如何将这种强大的功能直接应用于实际应用中。随着内容的展开,读者将逐步掌握如何灵活使用ChatGLM3-6B的强大功能,开发出智能化的解决方案,满足不断变化的业务需求。原创 2024-04-19 07:36:56 · 3377 阅读 · 29 评论 -
AI大模型探索之路-应用篇17:GLM大模型-大数据自助查询平台架构实践
在众多大型企业中,数据资产庞大无比,因此它们纷纷构建了多种大数据平台。然而,关键在于如何高效地利用这些数据,例如,将数据有效地提供给产品经理或数据分析师以供他们进行设计和分析。在传统工作流程中,由于这些角色通常不是技术专家,他们往往无法直接使用和操控SQL,导致必须依赖技术人员来编写SQL查询并返回结果,然后才能由产品经理、数据分析师或其他相关人员进一步处理。原创 2024-04-20 07:43:10 · 6071 阅读 · 46 评论 -
AI大模型探索之路-实战篇3:基于私有模型GLM-企业级知识库开发实战
在当今信息时代,数据已经成为企业的核心资产之一。对于许多企业而言,信息安全和私密性是至关重要的,因此对外部服务提供的数据接口存在天然的警惕性。因此常规的基于在线大模型接口落地企业知识库项目,很难满足这些企业的安全需求。面对这样的挑战,只有私有化的部署方案才能满足企业需求;在实战篇2中《AI大模型探索之路-实战篇2:基于CVP架构-企业级知识库实战落地》,设计实现了基于CVP架构的企业知识库。本篇文章中将对企业知识库进行进一步的改造升级,以满足企业安全性方面的需求;原创 2024-04-22 08:22:25 · 4512 阅读 · 94 评论 -
AI大模型探索之路-训练篇22: ChatGLM3微调实战-从原理到应用的LoRA技术全解
在自然语言处理的浪潮中,Transformer架构以其独特的设计和卓越性能,成为了大语言模型的基石。ChatGLM3,作为其中的一员,通过微调在特定任务上展现了其强大的适应性和灵活性。本文将深入探讨ChatGLM3的架构设计,微调策略,并提供实战案例,以期为开发者提供宝贵的参考。原创 2024-05-13 11:17:13 · 7407 阅读 · 162 评论 -
AI大模型探索之路-训练篇23:ChatGLM3微调实战-基于P-Tuning V2技术的实践指南
在人工智能的广阔领域里,大语言模型(LLMs)的微调技术扮演着至关重要的角色。它不仅为模型注入了适应特定任务的能力,而且还是通往专业领域的关键。本文旨在深入探讨基于P-Tuning V2技术的ChatGLM3微调流程,这是一种将因果语言模型与对话优化相结合的优秀实践,我们希望借此引领读者深入了解大模型微调的内涵。在上文中,我们详细介绍了基于LoRA技术微调ChatGLM3的操作过程。而本文将重点展示基于P-Tuning V2技术的微调过程。原创 2024-05-15 19:20:43 · 10572 阅读 · 176 评论 -
AI大模型探索之路-训练篇24:ChatGLM3微调实战-多卡方案微调步骤详解
在现代自然语言处理(NLP)任务中,随着模型规模的扩大和训练数据的增多,单张GPU的显存已经无法满足大模型的训练需求。为了充分利用多张GPU进行并行训练,我们需要了解不同的并行策略。本文将详细介绍ChatGLM3微调实战中的多卡方案及其步骤。这三篇论文共同构成了DeepSpeed项目的理论基础,它们不仅展示了如何通过技术创新来解决大规模模型训练中的挑战,还为深度学习社区提供了实用的工具和方法。原创 2024-05-17 21:51:35 · 7879 阅读 · 193 评论 -
AI大模型探索之路-训练篇25:ChatGLM3微调实战-基于LLaMA-Factory微调改造企业级知识库
在当前信息技术迅猛发展的时代,知识库的构建与应用已成为企业竞争的关键。随着自然语言处理技术的不断进步,基于微调的企业级知识库改造落地方案受到越来越多的关注。在前面的系列篇章中我们分别实践了基于CVP架构-企业级知识库实战落地和基于基于私有模型GLM-企业级知识库开发实战;本文将深入探讨和实践一种基于微调技术的企业级知识库改造方法,以期为企业提供更加高效、安全和可靠的知识管理解决方案。原创 2024-05-20 22:52:22 · 10993 阅读 · 183 评论 -
AI大模型探索之路-基础篇5:GLM-4解锁国产大模型的全能智慧与创新应用
随着人工智能技术的飞速发展,大型预训练语言模型已成为推动行业进步的重要力量。它们在理解自然语言、生成文本、执行复杂任务等方面展现出惊人的能力。在此背景下,国产大模型GLM-4的问世,不仅展现了中国在AI领域的实力,也为国内外研究者和开发者提供了新的研究与应用平台。原创 2024-05-22 20:08:15 · 8342 阅读 · 0 评论 -
【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践
在人工智能领域,大型语言模型的发展日新月异。阿里云推出的通义千问-7B(Qwen-7B)模型,以其70亿参数的庞大规模,成为该领域的新星。基于先进的Transformer架构,Qwen-7B在海量且多样化的预训练数据上进行深入学习,这些数据不仅包括了丰富的网络文本,还涵盖了专业书籍、代码等多种形式的内容。进一步地,Qwen-7B-Chat作为其衍生的AI助手模型,通过精准的对齐机制,展现了大语言模型在对话交互中的卓越性能。原创 2024-07-01 08:00:00 · 4762 阅读 · 119 评论 -
【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人
在这个信息爆炸的时代,人工智能技术正逐渐渗透到我们生活的方方面面。特别是在自然语言处理领域,大型语言模型如Qwen2正以其卓越的对话能力,为用户带来前所未有的交互体验。本文将详细介绍如何利用强大的transformers库与Qwen2-7B-Instruct模型进行智能对话,无论是在流式模式还是非流式模式下,都能轻松实现。原创 2024-07-02 14:05:20 · 6324 阅读 · 15 评论 -
【Qwen2部署实战】探索Qwen2-7B:通过FastApi框架实现API的部署与调用
在人工智能的快速发展中,大型语言模型(LLM)逐渐成为研究和应用的新宠。它们在自然语言处理(NLP)领域的广泛应用,如文本生成、翻译、摘要等任务中展现出了卓越的性能。Qwen2-7B作为其中的一个代表,不仅因其强大的能力受到关注,更因其开源的特性,让广大研究者和开发者能够自由地使用和创新。本文将详细介绍在AutoDL平台上部署Qwen2-7B模型,并利用FastAPI框架创建API服务的全流程。原创 2024-07-04 10:19:14 · 4168 阅读 · 16 评论 -
【Qwen2部署实战】Ollama上的Qwen2-7B:一键部署大型语言模型指南
在自然语言处理的前沿,大型语言模型(LLM)如Qwen2-7B正以其卓越的性能,开启智能应用的新篇章。然而,这些强大模型的本地部署往往因技术门槛而受限。Ollama上的Qwen2-7B:一键部署大型语言模型指南,为您提供了解决方案。原创 2024-07-06 08:41:45 · 9789 阅读 · 83 评论 -
【Qwen2部署实战】llama.cpp:一键部署高效运行Qwen2-7B模型
在人工智能的快速发展中,大型语言模型(LLM)如Qwen2-7B正成为研究和应用的焦点。这些模型以其强大的理解和生成语言的能力,正在不断推动智能应用的边界。然而,高效的部署和运行这些模型往往需要专业的知识和配置。`llama.cpp`库的出现,为这一问题提供了解决方案,它允许用户一键部署并高效运行Qwen2-7B模型。原创 2024-07-07 08:00:00 · 3979 阅读 · 14 评论 -
【Qwen2部署实战】部署高效AI模型:使用vLLM进行Qwen2-7B模型推理
在当今快速发展的人工智能领域,大型语言模型(LLMs)已成为推动自然语言处理(NLP)任务的关键力量。这些模型以其强大的理解和生成文本的能力而闻名,但同时也因其对计算资源的高需求而备受关注。vLLM作为一个创新的解决方案,旨在简化LLMs的部署流程,提高效率,降低资源消耗。本文将详细介绍如何利用vLLM部署Qwen2-7B模型,并探讨其在离线推理、API服务以及多卡分布式部署中的应用。原创 2024-07-08 08:00:00 · 9352 阅读 · 108 评论 -
【RAG检索增强生成】LlamaIndex与Qwen2的高效检索增强生成实践
在当今人工智能的快速发展中,大模型技术以其卓越的数据处理和语言理解能力,成为智能化进程的强大推动力。特别是检索增强生成(RAG)技术,它巧妙地融合了检索系统的高效性和生成模型的创造性,为智能问答系统的发展开辟了新天地。本文将详细阐述如何结合LlamaIndex和Qwen2,快速部署RAG技术,实现与外部数据的深度集成和智能交互。原创 2024-07-22 08:00:00 · 3395 阅读 · 89 评论 -
【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南
在人工智能领域,自然语言处理(NLP)一直是研究的热点之一。随着深度学习技术的不断发展,大型预训练语言模型(如Qwen2-7B-Instruct)在理解与生成自然语言方面取得了显著的进展。然而,这些模型往往需要大量的计算资源和数据来进行微调,以适应特定的应用场景。Lora微调技术作为一种高效的模型优化手段,为解决这一问题提供了新的思路。本文将深入探讨Lora微调技术在Qwen2-7B-Instruct模型上的应用,旨在为读者提供一种高效、低成本的模型定制化方法。原创 2024-07-24 08:00:00 · 19597 阅读 · 102 评论 -
【Qwen2微调实战】LLaMA-Factory框架对Qwen2-7B模型的微调实践
在人工智能的浪潮中,大型语言模型(LLMs)正逐渐成为研究和应用的热点。它们在自然语言处理(NLP)的各个领域,如文本生成、翻译、问答等任务中展现出了卓越的能力。Qwen2-7B模型,作为该领域的佼佼者,不仅因其庞大的参数量和强大的表示能力受到关注,更因其在微调后能够更好地适应特定任务而备受关注。本文将详细介绍如何利用LLaMA-Factory这一高效的微调框架对Qwen2-7B进行微调,以期达到提升模型在特定任务上的表现。原创 2024-07-29 07:30:00 · 23876 阅读 · 100 评论 -
【Qwen-Audio部署实战】Qwen-Audio-Chat模型之FastApi部署实战
在当今的自然语言处理领域,先进的模型不断涌现,为我们带来更出色的语言交互体验。Qwen-Audio-Chat 模型便是其中的佼佼者,本文将详细介绍如何通过 FastApi 对其进行部署,助您在实际应用中充分发挥其强大功能。原创 2024-07-30 08:00:00 · 2927 阅读 · 75 评论 -
【Qwen-Audio部署实战】Qwen-Audio-Chat模型之对话机器人部署测试
在自然语言处理的浩瀚星海中,Qwen-Audio-Chat 模型以其卓越的性能和创新性,犹如一颗冉冉升起的新星,照亮了智能对话技术的前行之路。它不仅代表着对话系统的前沿发展,更是为实现自然、流畅且富有洞察力的交流体验提供了坚实的技术基础。本文将带领读者深入探讨 Qwen-Audio-Chat 模型的部署与测试流程,揭示其背后的技术奥秘,共同踏上这段充满挑战与创新的技术探索之旅。我们将重点介绍如何在 web 端构建并测试一个基于 Qwen-Audio-Chat 模型的对话机器人。原创 2024-08-01 08:00:00 · 5859 阅读 · 64 评论 -
【GLM-4开发实战】Function Call进阶实战:外部函数调用回顾
在人工智能领域,Function Call是大模型能力扩展的核心。它不仅在Retrieval-Augmented Generation(RAG)中扮演着重要角色,也是Agent智能体架构设计中不可或缺的一部分。本文将深入探讨GLM-4模型中Function Call的进阶应用,通过实战案例,回顾并总结外部函数调用的技巧与经验。原创 2024-08-05 00:21:05 · 3700 阅读 · 0 评论 -
【GLM-4开发实战】Function Call进阶实战:常见挑战之意图识别处理
在人工智能领域,Function Call(函数调用)是实现智能系统功能的关键技术之一。然而,在实际应用中,Function Call面临着诸多挑战,尤其是意图识别问题。本文将深入探讨这些挑战,并提供相应的解决方案。原创 2024-08-06 08:00:00 · 2178 阅读 · 0 评论 -
【GLM-4开发实战】Function Call进阶实战:常见挑战之海量函数处理
随着人工智能技术的不断进步,Function Call(函数调用)在智能系统中扮演着越来越重要的角色。然而,随着函数数量的急剧增加,如何高效管理和调用这些函数成为了一个亟待解决的问题。本文将深入探讨海量函数带来的挑战,并提供相应的解决方案。原创 2024-08-07 08:00:00 · 1139 阅读 · 0 评论 -
【GLM-4开发实战】Function Call进阶实战:常见挑战之并发调用处理
在人工智能的快速发展中,Function Call作为智能系统的核心功能之一,其并发调用能力成为衡量系统性能的关键指标。然而,随着应用场景的复杂化,如何高效地处理函数的并发调用成为了一个技术挑战。本文将深入探讨这一问题,并提供有效的解决策略。原创 2024-08-08 08:00:00 · 1453 阅读 · 0 评论 -
【GLM部署实战】探索 CogVLM2:多模态智能的前沿技术与应用实践
在人工智能的多模态范畴,将视觉信息与语言处理加以融合的技术正在急速演进。CogVLM2 作为此趋势的典型代表,乃是一款开源的视觉语言模型,其通过对视觉和语言信息的有效整合,极大地增强了模型在多模态任务里的表现水平。本文将会详尽阐述 CogVLM2 的技术特性、功能应用,并且为您提供切实可行的实践指南。原创 2024-08-09 08:00:00 · 2503 阅读 · 13 评论 -
【GLM-4部署实战】GLM-4-9B-Chat模型本地部署实践指南
在人工智能的浪潮中,深度学习模型的部署已成为技术研究和实践的热点。自然语言处理(NLP)领域,尤其是对话系统,正迅速成为智能应用的核心。GLM-4-9B-Chat模型以其卓越的语言理解与生成能力,为构建智能对话系统提供了坚实的基础。然而,模型的部署并非易事,它涉及到环境配置、依赖管理、代码编写等多个环节。本文将通过本地模型推理和OpenAI API风格服务发布测试,带你一步步完成GLM-4-9B-Chat模型的部署实践,让你对深度学习模型的部署有一个全面而深入的理解。原创 2024-08-13 08:00:00 · 11343 阅读 · 74 评论 -
【GLM-4部署实战】GLM-4-9B-Chat模型之对话机器人部署测试
在人工智能的浪潮中,对话机器人作为人机交互的重要形式,正逐渐渗透到我们生活的方方面面。GLM-4-9B-Chat模型,以其强大的语言处理能力,为构建智能对话系统提供了坚实的基础。本文将带你一步步完成该模型的部署和测试,让你亲眼见证一个高效对话机器人的诞生。原创 2024-08-14 08:00:00 · 4786 阅读 · 0 评论 -
【GLM-4部署实战】GLM-4-9B-Chat模型之vLLM部署推理实践
在人工智能的广袤领域中,大型语言模型(LLM)的推理和部署是实现智能应用的关键步骤。vLLM框架,以其卓越的性能和易用性,为大型语言模型的高效运行提供了强有力的支持。本文将深入探讨如何利用vLLM框架,对GLM-4-9B-Chat模型进行部署和推理,以实现高性能的对话机器人服务。原创 2024-08-15 08:00:00 · 4058 阅读 · 0 评论 -
【GLM-4微调实战】GLM-4-9B-Chat模型之Lora微调实战
在人工智能的广阔天地里,深度学习模型的微调技术扮演着至关重要的角色。它使我们能够根据特定任务的需求,对预训练模型进行精细调整,从而获得更优的性能表现。本文将深入探讨如何针对GLM-4-9B-Chat模型实施Lora微调,期待在特定领域中实现更高的准确度和效率。原创 2024-08-16 14:10:44 · 5202 阅读 · 15 评论 -
国产开源代码模型之光:CodeGeeX4 - ALL - 9B本地部署体验实战大全
在当今这个数字化进程飞速推进的时代,软件开发的效率与质量已成为决定项目成败的关键要素。代码生成模型作为一种极具创新性的技术手段,宛如一场悄然兴起的革命,正逐步重塑着开发者的工作模式与流程。CodeGeeX4 - ALL - 9B 的惊艳登场,毫无疑问地为这一领域注入了一股磅礴且强劲的力量。原创 2024-08-19 08:00:00 · 4453 阅读 · 92 评论 -
国家超算互联网平台:模型服务体验与本地部署推理实践
在当今快速发展的人工智能领域,高性能计算平台的重要性不言而喻。国家超算互联网平台作为其中的重要一环,不仅提供了强大的计算资源,还通过其丰富的模型服务和便捷的操作体验,吸引了众多技术爱好者和专业人士的关注。本文将深入探讨该平台的显卡选用、模型服务体验以及本地模型推理体验,带您全方位了解这一前沿技术平台。# 定义一个简短的介绍大型语言模型的提示# 构建消息列表,包括系统角色和用户角色的内容国家超算互联网平台以其高效计算能力和用户友好的操作体验,为人工智能领域的研究和应用提供了强有力的支持。原创 2024-07-31 08:00:00 · 3249 阅读 · 74 评论 -
MiniCPM-V 2.6:端侧最强多模态大模型探索【本地部署实践】
MiniCPM-V 2.6 是由面壁智能推出的一款端侧 AI 多模态模型。它在保持较小参数规模的同时,展现出了强大的多模态处理能力,能够处理图像、视频等多种数据类型,并实现了一系列先进的功能。这款模型的出现,为端侧设备上的人工智能应用提供了新的可能性。原创 2024-08-22 08:00:00 · 8835 阅读 · 96 评论 -
MiniCPM-V 2.6:端侧最强多模态大模型探索【推理实战大全】
MiniCPM-V 2.6 支持多种部署推理方案,包括 vllm、llama.cpp、Ollama、transformers 等。这些方案各有特点,能够满足不同用户的需求。本文将主要聚焦于 vllm和llama.cpp 这两种推理方案的体验实践,为大家展示 MiniCPM-V 2.6 在不同部署环境下的强大功能。原创 2024-08-23 08:00:00 · 2858 阅读 · 101 评论 -
MiniCPM-V 2.6:端侧最强多模态大模型探索【微调实战体验】
在先前的篇章中,我们已然沉浸式体验了 MiniCPM-V 2.6 模型的本地部署和推理实战,而在本篇中,我们将踏上一场更为深入的探索之旅 ——MiniCPM-V 2.6 的微调实践。这一实践不仅是对模型性能的进一步挖掘,更是为了满足各种特定应用场景的需求,开启多模态大模型的无限可能。原创 2024-08-24 08:00:00 · 2792 阅读 · 19 评论
分享