大模型_GGbond-CSDN博客

大家好,今天为大家介绍一篇Mamba最新研究论文。本文提出了一个新框架Structured State Space Duality (SSD),通过结构化矩阵的视角,统一了State Space Model (SSM)和注意力机制。基于该框架设计的Mamba-2,其核心是对Mamba中SSM进行了改进,在与Transformer表现相当的同时,速度提高了2-8倍。

2024-10-12 09:49:48 737

原创李开复、周鸿祎强烈推荐！实战AI大模型+动手做AI Agent （附PDF）

李开复、周鸿祎强烈推荐！实战AI大模型+动手做AI Agent （附PDF）

2024-10-11 15:19:06 614

原创基座大模型GLM-4-Plus引领，智谱全模型家族全面上线

智谱在近期发布的若干更新模型，以基座大模型 GLM-4-Plus 推出为标志。智谱很高兴宣布，全模型家族正式上线bigmodel.cn，包括新基座大模型 GLM-4-Plus，这是智谱迄今为止最强大的模型，成为智谱全模型家族坚实的能力底座。

2024-10-11 15:11:42 722

原创 AI大模型行业必看案例集！2024大型模型典型示范应用案例集+具身智能大模型发展报告！

AI大模型行业必看案例集！2024大型模型典型示范应用案例集+具身智能大模型发展报告！

2024-10-10 13:58:13 365

原创【AI大模型】《语音大语言模型》最新进展综述

大型语言模型 (LLMs) 近期因其文本交互能力而受到广泛关注。然而，自然的人类互动通常依赖语音，这促使人们向语音模型转变。

2024-10-10 13:39:49 1117

原创《Python机器学习》作者新作--- 从零构建大模型来了！

因此，我们选择一种更通用的方法，匹配输出节点与分类的数量。模型的输出层经过调整，输出张量仅包含 2 列，为了完成分类微调，我们专注于输出的最后一行，对应的最后一个 token。我们将原始输出层（这层的功能是将模型内部生成的隐藏表示转换为一个包含 50,257 个 tokens 的词表）替换为一个较小的输出层，该层映射到两个类别：0（非垃圾邮件）和 1（垃圾邮件），如下图 4 所示。简单来说，在垃圾邮件分类任务上，更小的 GPT-2（124M）与更大 BERT（340M）的性能类似，具体如下表 3 所示。

2024-10-09 16:29:27 963

原创这三本书就是学AI大模型的神！大模型人请务必翻烂！！！自学AI大模型书籍推荐，附电子版

这三本书就是学AI大模型的神！大模型人请务必翻烂！！！自学AI大模型书籍推荐，附电子版

2024-10-08 14:02:11 1119

原创 AI大模型实战：pytorch安装

今天我们要聊聊如何安装PyTorch，一个在科学计算和数据分析领域广泛应用的流行深度学习框架。安装PyTorch需要一些步骤，但不用担心，我会一步步指导你。

2024-10-08 13:50:32 774

原创 RAG性能优化杀器，引入上下文检索！

开发者通常通过 RAG扩展 AI 模型的知识。RAG 是一种从知识库中检索相关信息并将其附加到用户提示词中的方法，从而显著提升模型的回答能力。但传统的 RAG 解决方案在编码信息时会丢失上下文，导致系统无法从知识库中检索到相关信息。

2024-10-07 14:34:45 861

原创大语言模型（LLM）的子模块拆拆分进行联邦学习

大语言模型（LLM）的子模块拆分进行联邦学习，主要涉及到将大模型的不同部分或功能模块在多个客户端或设备上进行分布式训练，同时保护数据隐私并提升模型性能。

2024-10-07 14:30:06 834

原创 2024大模型畅销的三本书！千言万语，尽在书中

哈咯各位，我们都知道2024年最火爆的技术非大模型莫属，而今天就给大家分享几本大模型方向2024年新出的书籍，主要分享这三本非常畅销的书----《Transformer自然语言处理实战》，《实战AI大模型》，《精通Transformer：从零开始构建最先进的NLP模型》。

2024-10-06 14:57:08 500

原创更新！大模型入门学习看这些书足够了

哈喽大家好！很久都没有更新大模型这块的书了，今天呢给大家推荐几本大模型的学习书籍！

2024-10-06 14:52:14 772

原创一书封神！吴恩达大模型入门 LLM CookBook 汉化版教程发布！

这次给大家推荐的是AI圈无人不知的吴恩达大佬+OpenAI团队一起编写的大模型入门文档，也就是这本：大型语言模型（LLM）的权威文档

2024-08-12 16:29:57 298

原创【清华出版】内行人都在学的大模型黑书外网爆火的LLM应用手册来了！

本书在详细介绍BERT、RoBERTa、T5 和GPT-3 等流行模型前，先讲述了Transformer 的架构以便为你的学习奠定坚实基础。在不到4 年的时间里，Transformer 模型以其强大的性能和创新的思想，迅速在NLP 社区崭露头角，打破了过去30 年的记录。本书将引领你进入Transformer的世界，将讲述不同模型和平台的优势，指出如何消除模型的缺点和问题。《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》分步展示如何微调GPT-3等预训练模型。

2024-08-11 23:45:37 383

原创 LLM大模型好书推荐丨大语言模型基础与前沿，豆瓣高分力荐！

哈喽啊，今天来给大家分享一本大模型方面的优质书籍，这本书是2024年正式出版发行的，读完后推荐给大家！

2024-08-10 15:57:49 843

AGI_GGbond的博客

原创 27K star！开源AI程序员，可独立完成95%的开发任务

原创推荐系统与大语言模型技术融合：EMNLP/NeurIPS相关论文导览

原创工业大模型：体系架构、关键技术与典型应用

原创 Transformer学会有手就行？这本 Transformer自然语言处理实战书无敌了

原创 2024年中国工业大模型行业发展研究报告｜附43页PDF文件下载

原创微软的RAG框架和GraphRAG

原创【AI大模型】Mamba2，比Transformer速度提高了8倍！