普通网友-CSDN博客

原创玩转大模型（二）启动一个大模型

写这篇文章是几个月前了，现在模型和框架已经更新了好几轮了，但不影响吧，后面会把这几个月的发展专门用一篇文章补上。

2024-10-15 16:37:56 598

原创打造自己的大模型｜01篇LLaMA-Factory微调Llama3和其占用资源分析

由于原生的Llama3模型训练的中文语料占比非常低，因此在中文的表现方面略微欠佳！本教程就以Llama3-8B-Instruct开源模型为模型基座，通过开源程序LLaMA-Factory来进行中文的微调，提高Llama3的中文能力！

2024-10-12 15:24:05 1151

原创实例详解 | 借助 Langchain 和 Gemma 2 构建 RAG 应用

本文将为您介绍如何使用 LangChain、NestJS 和 Gemma 2 构建关于 PDF 格式 Angular 书籍的 RAG 应用。

2024-10-11 21:40:37 706

原创手搓LLM大模型，这2本大模型书必看！从零开始构建大语言模型+自然语言处理：大模型理论实践

手搓LLM大模型，这2本大模型书必看！从零开始构建大语言模型+自然语言处理：大模型理论实践

2024-10-10 15:16:48 664

原创【AI大模型】你的Agent稳定吗？——基于大模型的AI工程实践思考

本文总结了作者在盒马智能客服的落地场景下的一些思考，从工程的角度阐述对Agent应用重要的稳定性因素和一些解法。

2024-10-10 15:13:05 1033

原创 2本书轻松入门大模型：大模型入门+自然语言处理：基于预训练模型的方法附PDF文档

人工智能是人类探索未来的重要领域之一，以GPT为代表的大模型应用一经推出在短短几个月时间内火爆全球。大模型代表了自然语言处理领域的一项伟大成就，它的诞生和发展正引领着我们走向全新的创作时代。

2024-10-08 15:37:32 870

原创【AI大模型】为什么说RAG是AI 2.0时代的“杀手级”应用？

随着 AI 2.0 时代的来临，我们正站在一个技术革新和行业变革的交汇点。大语言模型虽然在多个领域取得了突破，但在特定领域的应用仍面临挑战。

2024-10-08 15:30:39 974

原创【LLM大模型】AI Agent 终结者 LangGraph！

LangGraph是一个用于构建具有状态、多参与者应用程序的大语言模型（LLM）的库，用于创建智能体和多智能体的工作流程。

2024-10-07 16:02:59 945

原创 AI大模型企业应用实战-Agents是什么？

智能体（Agent）不仅会改变每个人与计算机交互的方式。它们还将颠覆软件行业，带来自我们从键入命令到点击图标以来最大的计算革命。

2024-10-07 15:59:27 1208

原创 Qwen2.5-Coder 技术报告详细解读

Qwen2.5-Coder 技术报告详细解读

2024-10-06 10:19:30 1714

原创奇书！电子科大出版，449 页！又一本开源免费的大模型书来了！

随着人工智能技术的飞速发展，自然语言处理成为了计算机科学与人工智能领域中不可或缺的关键技术之一。作为一名长期致力于人工智能和自然语言处理研究的学者，今天给大家推荐的这本《自然语言处理：大模型理论与实践》正是学NLP自然语言非常牛逼的一本书！

2024-10-06 10:17:35 386

原创开源大语言模型作为 LangChain 智能体

开源大型语言模型 (LLMs) 现已达到一种性能水平，使它们适合作为推动智能体工作流的推理引擎: Mixtral 甚至在我们的基准测试中超过了 GPT-3.5，并且通过微调，其性能可以轻易的得到进一步增强。

2024-10-04 08:45:00 1815

原创大模型与LLM语言分析：如何利用LLM做多模态任务？

大型语言模型LLM（Large Language Model）具有很强的通用知识理解以及较强的逻辑推理能力，但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力，但目前还未开放多模态输入接口并且不会透露任何模型上技术细节。因此，现阶段，如何利用LLM做一些多模态任务还是有一定的研究价值的。

2024-10-03 07:15:00 1681

原创聊聊大模型的应用及微调

模型的微调有多种方式，对于入门的来说，一般都是基于官方的文档微调；最近发现很多开源库，其目的就是支持应用多种微调策略来微调模型，简化模型的微调门槛。

2024-10-02 09:15:00 925

原创使用AI进行需求分析的案例研究

生成式 AI 的潜在应用场景似乎无穷无尽。虽然这令人兴奋，但也可能让人不知所措。因此，团队在使用这项技术时需要有明确的目标：关键是要明确生成式 AI 在团队工作中能产生哪些实质性影响。

2024-10-01 09:45:00 1771

原创 LLM大模型好书推荐 | 《LangChain入门指南》系统的LLM应用开发指南

LangChain作为大模型集成框架鼎鼎大名，最近刚出的这本《LangChain入门指南》是一本很及时的书，值得推荐～

2024-09-30 10:12:49 1057

原创深入理解LLM的可观测性

特定的和实现（请参见“可观测性”列）允许配置这些事件包含的属性包括OpenTelemetry 生成 AI 语义约定中的描述，例如：以下是使用映射允许在onRequestonResponse和onError方法之间传递信息。

2024-09-28 17:23:05 451

原创使用 FastGPT 构建高质量 AI 知识库

自从去年 12 月 ChatGPT 发布以来，带动了一轮新的交互应用革命。尤其在 GPT-3.5 接口全面开放后，大量的 LLM 应用如雨后春笋般涌现。然而，由于 GPT 的可控性、随机性和合规性等问题，很多应用场景都没法落地。

2024-09-27 21:03:37 1221

原创玩转腾讯混元大模型——带您解读各个功能

自从2022年的OpenAI公司推出chatGPT人工智能聊天机器人，从此人工智能大模型便在各国可所谓风靡一时，不断涌现出各种各样的大模型，深得用户喜爱。然而在此领域中，腾讯也研发出了自己的大语言模型，下面我们一起来了解一下。

2024-09-24 16:09:04 1699

原创新手操作指引：快速上手腾讯混元大模型

腾讯混元大模型是一款功能强大的AI工具，适用于文本生成、图像创作和视频生成等多种应用场景。对于新手用户，快速上手并充分利用这一工具可能会有些挑战。本文将提供详细的新手操作指引，帮助您轻松开始使用腾讯混元大模型。

2024-09-24 16:05:49 1947

原创 Github 26k stars！从零构建大模型，大模型入门经典书籍！

如今市面上关于大模型的书籍和教程可谓琳琅满目，但基本上都只是从原理和参数调优上讲解的，没有一本系统性的书籍告诉我们如何从零构建一个专属大模型。

2024-09-21 10:17:09 644

原创华为上研所-计算视觉、大模型研究实习生招聘

华为上研所-计算视觉、大模型研究实习生招聘

2024-09-20 21:04:12 437

原创如何转行成为高薪 AI 产品经理？一文说清快速入门方法！！

想凭工作几年积累的经验，跳个槽，结果打开招聘软件一看：不懂AI技术的产品经理，都快要被淘汰了！

2024-09-18 21:24:38 943

原创如何从传统产品经理转行成为顶尖的AI产品经理？

要想知道具体如何转行成为顶尖的AI产品经理，我们首先要明确两个问题，即：什么是AI产品经理？为什么要转行AI产品经理？

2024-09-18 21:20:58 1085

原创使用LLaMA Factory来训练智谱ChatGLM3-6B模型

使用LLaMA Factory来训练智谱ChatGLM3-6B模型

2024-09-16 09:15:00 1190

原创从零开始的ChatGLM 配置详细教程

从零开始的ChatGLM 配置详细教程

2024-09-15 08:15:00 1206

原创【大模型】搭建本地私有AI大模型智能体

Ollama是一个开源的AI模型部署工具，可以帮助用户在本地环境或云端部署和管理大型语言模型。它的主要功能包括模型加载、推理服务和与用户接口的集成。

2024-09-14 11:31:30 1818

原创 Qwen1.5模型文本分类微调实战教程

大家好啊!今天咱们来聊聊怎么给大语言模型"调教"一下，让它在文本分类这个任务上玩得更溜。具体来说，我们要用Qwen1.5这个模型来做文章。别看这活儿听着高大上，其实做起来也没那么难。跟着我来，保证让你轻松上手!

2024-09-12 20:25:21 1390

原创大模型书籍丨深入浅出的 Transformer 学习，这本大模型应用解决方案太香了

说到Transformer，这个已经是无数人谈论的神经网络的基础架构之一了。但是这期间又有无数的好的，极好的，不好的信息，所以如果你要真的了解它，找本好书来仔细看一下，其实是对得起自己的最好方式！

2024-09-12 20:10:21 852

原创 Langchain到底多牛？简单使用 LangChain 实现翻译功能

不久前，国内的头部大模型厂商智谱 AI ，刚刚推出了 `glm-4-0520` 模型，该模型被认为是当前平台最先进的模型，具备 128k 的上下文长度，并且相较于前一代模型，指令遵从能力大幅提升 18.6%。可以看出，智谱AI对于该模型寄予厚望。

2024-09-09 15:33:56 1213

原创手搓LLM大模型：从零开始构建大语言模型

在人工智能的世界里，大型语言模型（LLMs）无疑是最引人注目的明星之一。这些深度神经网络模型的出现，为自然语言处理（NLP）领域带来了前所未有的变革。那么，这些模型究竟是如何工作的？它们又是如何从简单的语言处理任务进化到能够理解和生成复杂文本的呢？

2024-09-06 17:04:35 1597

原创大语言模型的32种消除幻觉的技术，你都了解吗？

大模型幻觉问题是计算机语言学中一个重要的研究方向。为减轻幻觉，研究人员提出了多种策略，比如反馈机制、外部信息检索等，但一直缺少一篇详细综述将近期关于幻觉的研究工作串联起来。

2024-09-06 16:47:34 1373

原创大模型GIT开源教程：3个月1Kstar，这个大模型开源教程正在光速崛起（附教程）

“五·一”节后第一个开心的消息是我们开源的大模型基础项目已经达到1k stars⭐️了。这个开源项目是为了提供浅显易懂且前沿的大模基础知识而打造的，能收获1k个stars⭐️也是对这个项目的肯定。我为一起付出努力的贡献者感到开心，也为这个课程的核心贡献者表达谢意。

2024-09-05 22:04:37 1139

原创【奶奶看了都会】Meta开源大模型LLama2部署使用教程，附模型对话效果

【奶奶看了都会】Meta开源大模型LLama2部署使用教程，附模型对话效果

2024-09-04 15:55:44 1112

原创 Llama 3.1 70B推理功能快速体验

Meta Llama 3.1 系列是一个多语言大型语言模型 (LLM) 集合，包括 8B、70B 和 405B 三种尺寸（文本输入/文本输出）。

2024-09-02 16:59:42 1058

原创大模型书籍分享丨这本书已经无敌！一本书学懂NLP自然语言（附PDF）

今天给大家推荐的这本《自然语言处理：基于预训练模型的方法》正是学NLP自然语言非常牛逼的一本书！

2024-09-02 16:21:46 717

原创必学大模型！决战Llama 3.1！史上最强的开源大杀器。。。

Llama 3.1是Meta最新推出的开源大语言模型，有三种规格：8B（80亿）、70B（700亿）和405B（4050）亿参数，支持八种语言，具备128K扩展上下文长度。它提供卓越的通用知识、数学计算、多语言翻译和工具使用能力，开放下载并允许开发者定制和微调。

2024-08-28 16:40:42 1314

原创轻松掌握 Llama 3.1：轻松本地部署与远程使用的全攻略

Llama 3.1 是 Meta（Facebook 的母公司）发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B（80 亿参数）、70B（700 亿参数）和 405B（4050 亿参数）模型。其中，405B 是 Meta 迄今为止最大的模型。

2024-08-28 16:35:41 1825

原创 LLM大型语言模型代理的安全与隐私综述

受大型语言模型（LLM）快速发展的启发，LLM代理已发展到能够执行复杂任务的阶段。LLM代理现在广泛应用于各个领域，处理大量数据以与人类互动并执行任务。LLM代理的广泛应用展示了其显著的商业价值；然而，这也暴露了其安全和隐私漏洞。

2024-08-26 16:20:43 1204

原创多模态大模型有何进展？西工大等最新《多模态大型语言模型》全面综述

在数据爆炸性增长和技术快速发展的时代，多模态大型语言模型（MLLMs）处于人工智能（AI）系统的前沿。MLLMs旨在无缝集成包括文本、图像、视频、音频和生理序列在内的多种数据类型，解决远远超出单一模态系统能力范围的复杂现实应用问题。

2024-08-26 16:18:43 1036

空空如也

空空如也