自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(320)
  • 收藏
  • 关注

原创 大模型笔记!以LLAMA为例,快速入门LLM的推理过程

本文借助llama这个模型快速入门LLM的推理过程,技术细节很多都是通用的,也适合其他的LLM。本篇也可以作为CV快速入门NLP简易指南。

2024-08-23 20:08:20 417

原创 150页的极简大模型入门蛇尾书,学大模型太简单了

在 2024 年开年,希望有幸给大家来个助推。推荐一本最近刚上市的新书《大模型应用开发极简入门:基于GPT-4和ChatGPT》,别名「蛇尾书」。

2024-08-23 20:03:56 843

原创 大模型好书推荐丨大模型入门最佳读物,蛇尾书-大模型应用开发极简入门

今天给大家推荐一本大模型应用开发入门书籍《大模型应用开发极简入门》,本书对很多AI概念做了讲解和说明

2024-08-20 17:59:24 640

原创 大模型好书推荐丨《大模型时代》开启人工智能狂潮!

《大模型时代》是最近正在读的一本非常有趣的书,这本书可以说是一本GPT科普读物,以拟人化的手法,在趣味中讲述了ChatGPT的原理。这本书在通俗性和专业性上并存,严谨性和趣味性同在,作者很会玩儿梗,使得科普读物不再乏味无趣。

2024-08-20 17:58:03 614

原创 Lag-Llama:时间序列大模型开源了!

我们将探讨Lag-Llama的架构、功能以及训练方式。还会通过代码将lagllama应用于一个预测项目中,并将其与其他深度学习方法Temporal Fusion Transformer (TFT) 和DeepAR进行性能比较。

2024-08-18 11:15:00 726

原创 Llama3.1 部署本地知识库应用

高性能应用服务 HAI 拥有丰富的预装应用,可以将开源社区的前沿模型快速转化为您专有的部署实践,一键拉起,即开即用。现已支持在HAI购买页的社区应用中,找到Llama 3.1等应用的入口,简单选型后,即可一键启动推理服务。

2024-08-17 07:15:00 1703

原创 谈谈对 Llama3的个人看法

LLAMA-3的发布是大模型开源届的大事,蹭下热度,在这里谈下有关LLAMA-3、大模型开源与闭源以及合成数据的一些个人看法那么,我们会继续按照Scaling law往后发展,就是继续增加新数据,推大模型规模,来持续增强模型能力。如果这样,AGI是可能通过大模型技术路线达到的,而在这种情况下,意味着需要相比目前数以十倍、百倍的资源投入,基本是个天文数字了,而在如此巨量投入的情况下,Meta等公司是否还会这样大力度支持开源就是有疑问的,此时开源模型是有可能越来越落后于闭源模型的。

2024-08-16 17:44:16 999

原创 开源中文类LLaMA大语言模型汇总

LLaMA可以说是今年最受欢迎的大语言模型之一,LLaMA的开源带动了大语言模型社区的兴起,许多模型例如Vicuna、Alpaca等应运而生。

2024-08-16 17:43:08 705

原创 【LLM大模型】100个大厂参与制作!中国信通院2024大模型典型示范应用案例集无敌了!

在此背景下,中国信息通信研究院将组织业界开源大模型治理专家和开源大模型应用单位,共同构思、编写《开源人工智能大模型应用指南》,指导企业安全、合规的使用开源人工智能模型,降低开源人工智能应用风险,最大程度释放技术效能,促进行业快速发展。

2024-08-15 17:23:37 669

原创 好书推荐!《Building LLM Apps》构建大语言模型LLM应用!一次性讲清楚!

Building LLM Apps》这本书是一份,它不仅介绍了大型语言模型(LLM)的基础知识和前沿技术,还深入探讨了如何将这些模型应用到实际的AI应用中。书中从对LLM的深入介绍入手,接着探讨了,分析了它们的优缺点及适用场景。本书的重点之一是。作者通过详细的案例,指导你,这些代理能够从非结构化数据中检索信息,并与结构化数据进行交互。此外,书中还介绍了大型基础模型(LFMs),这些模型在的基础上,还能处理。

2024-08-15 17:22:43 160

原创 大白话!解析LLM大模型原理!

本文旨在以非技术、非数学的方式解释LLM的工作原理,包括词向量、Transformer模型及其训练方式,以及为何需要海量数据来取得良好性能。

2024-08-14 20:06:22 786

原创 【LLM大模型】本地部署私人知识库的大模型!Llama 3 + RAG!

在今天的的教程中,我们将打造更加个性化的大模型,可以定制搭载私人知识库的本地大模型!

2024-08-14 20:04:01 845

原创 大模型开源教程「动手学大模型应用开发」,从零基础到掌握大模型开发的关键技能!

随着国内外井喷式的 LLM API 服务开放,如何基于 LLM API 快速、便捷地开发具备更强能力、集成 LLM 的应用,开始成为开发者的一项重要技能。

2024-08-13 21:48:59 369

原创 无敌!20.6K+ Star!一个开源的LLM(大型语言模型)应用开发平台

Dify 是一个开源的LLM(大型语言模型)应用开发平台,它通过直观的界面结合了AI工作流程、RAG(检索-分析-生成)管道、代理功能、模型管理、可观察性特性等,使用户能够快速从原型设计转向产品生产。

2024-08-13 21:41:01 868

原创 LLM大模型微调部署 -Ollama

LLaMA 模型因其高效的性能和较小的模型尺寸而受到关注,这使得它们能够在资源有限的环境中运行,例如个人计算机或移动设备。

2024-08-12 21:10:03 1027

原创 【高级RAG技巧】在大模型知识库问答中增强文档分割与表格提取

文档分割是一项具有挑战性的任务,它是任何知识库问答系统的基础。高质量的文档分割结果对于显著提升问答效果至关重要,但是目前大多数开源库的处理能力有限。

2024-08-12 21:05:11 796

原创 动手学大模型开源教程:上海交通大学出品零基础快速入门LLM大模型(附课件)

前有 李沐 大神的动手学深度学习,现有 上海交大 的动手学大模型教程,对大模型感兴趣的直接冲!

2024-08-10 10:17:06 536

原创 大模型开源教程:llm-action,让天下没有难学的大模型

今天给大家推荐这个大模型入门学习项目,实在是太香了太香了,目前该项目已经超过5k星,具体的文章分类如下所示。

2024-08-10 10:13:38 1074

原创 从模型到前端,你应该知道的LLM生态系统指南

LLM在在2023年发展的风生水起,一个围绕LLM的庞大生态系统正在形成,本文通过介绍这个生态系统的核心组成部分,来详细整理LLM的发展。

2024-08-08 20:58:33 966

原创 【LLM大模型】精选 50 个大模型高频面试题!

针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。

2024-08-08 20:26:18 1007

原创 【我奶奶看了都会】Meta开源大模型LLama2部署使用教程,附模型对话效果

就在7月19日,MetaAI开源了LLama2大模型,Meta 首席科学家、图灵奖获得者 Yann LeCun在推特上表示Meta 此举可能将改变大模型行业的竞争格局。一夜之间,大模型格局再次发生巨变。

2024-08-07 22:09:56 726

原创 好书推荐|LLM大模型必学《Transformer自然语言处理实战》(附PDF)

今天又来给大家分享ai大模型书籍了,今天是这本非常畅销的书----《Transformer自然语言处理实战》涵盖了Transformer在NLP领域的主要应用。

2024-08-06 20:14:04 1114

原创 《Building LLM Apps》构建大语言模型LLM应用!一次性讲清楚!

《Building LLM Apps》这本书是一份全面而实用的指南,它不仅介绍了大型语言模型(LLM)的基础知识和前沿技术,还深入探讨了如何将这些模型应用到实际的AI应用中。

2024-08-06 20:12:40 445

原创 【LLaMA-Factory 】高效微调 100 多种大语言模型:先计算法,急速推理

LLaMA-Factory 是一个用于高效微调 100 多个大型语言模型(ACL 2024)的 WebUI。

2024-08-05 16:25:00 696

原创 Awesome-Chinese-LLM:开源中文大语言模型整理

Awesome-Chinese-LLM 是整理开源的中文大语言模型,主要包括规模较小、可私有化部署、训练成本较低的模型,涵盖底座模型、垂直领域微调及应用、数据集与教程等。

2024-08-05 16:21:37 1044

原创 【大模型好书推荐】超级重磅!《大语言模型综述》新书出炉,中国人民大学出版,391页pdf(附PDF)

在2023年3月,我们发表了大语言模型综述文章《A Survey of Large Language Models》。这篇综述文章已经更新到第13个版本,包含了83页的正文内容,并收录了900余篇参考文献。

2024-08-02 21:11:00 605

原创 【LLM大模型】基于LLM大模型Agent的适用范围和困境

本文提到大模型通常的工作方式,即通过提示词进行问答,并指出了两个主要问题:历史对话信息的管理和令牌数量的限制。

2024-08-01 15:08:55 274

原创 分布式训练:大规模AI模型的实践与挑战

随着人工智能的发展,深度学习模型变得越来越复杂,数据集也越来越大。为了应对这种规模的增长,分布式训练成为了训练大规模AI模型的关键技术。本文将介绍分布式训练的基本概念、常用框架(如TensorFlow和PyTorch)、最佳实践以及可能遇到的性能瓶颈和解决方案。

2024-08-01 15:05:33 356

原创 【LLM大模型】AI大模型大厂面试真题:「2024大厂大模型技术岗内部面试题+答案」

AI大模型岗的大厂门槛又降低了!实在太缺人了,大模型岗位真的强烈建议各位多投提前批,▶️众所周知,2025届秋招提前批已经打响,🙋在这里真心建议大家6月7月一定要多投提前批!

2024-07-31 16:22:53 1236

原创 【LLM大模型】落地RAG系列:RAG入门及RAG面临的挑战和解决方案!!

2023 年以来,RAG 已成为基于大模型的人工智能系统中应用最为广泛的架构之一。因此对 RAG 应用的性能、检索效率、准确性的研究成为核心问题。

2024-07-31 16:14:39 1055

原创 LLM大语言模型-ChatGPT、LLaMA、ChatGLM、文心一言、通义千问

LLM表现出PLM所没有的Emergent Abilities(涌现能力),这些能力是LLM在复杂任务上表现惊人的关键,使得得人工智能算法前所未有的强大,但这些能力是如何获得的还不具有理论支持

2024-07-30 17:41:26 687

原创 【LLM大模型】基于 AnythingLLM 及 Ollama 构建本地知识库

RAG(Retrieval Augmented Generation)检索增强生成,是 2023 年最火热的 LLM 应用系统架构,它的作用简单来说就是通过检索获取相关的知识并将其融入 Prompt,让大模型能够参考相应的知识从而给出合理回答。

2024-07-30 17:39:21 812

原创 【LLM大模型】基于RAG检索实现智能客户系统

RAG(Retrieval-Augmented Generation)检索技术是一种结合信息检索(Retrieval)和生成(Generation)的混合模型方法,旨在通过检索相关信息来增强生成模型的性能。RAG 技术特别适用于需要复杂背景信息或大规模知识库支持的任务,如问答系统、对话系统和文本生成等。

2024-07-29 11:17:31 554

原创 RAG 为什么需要文本分割(Chunking)

在构建与LLM相关的应用程序时,`Chunking`是将大量文本分解为较小段的过程。这是很重要的一环,有助于优化从向量数据库中获得的LLM上下文嵌入内容的相关性。

2024-07-29 11:12:08 767

原创 全方位解析Agent!这本 大模型应用开发-动手做AI Agent 值得一读!

本书将探索Agent的奥秘,内容包括从技术框架到开发工具,从实操项目到前沿进展,通过带着读者动手做7个 功能强大的Agent,全方位解析Agent的设计与实现。最后展望了Agent的发展前景和未来趋势。

2024-07-25 15:53:40 1076

原创 AI智能体(Agent)解析:工作流程与市场应用

智能体(Agent)是一种在特定环境中自主行动、感知环境、做出决策并与其他智能体或人类进行交互的计算机程序或实体。它们具备自主性、反应性、社交性和适应性等特点,能够根据环境的变化调整自己的行为,以达到预设的目标。

2024-07-22 11:18:23 825

原创 AI大模型:全面解读大模型LLM的微调

在快速发展的人工智能领域中,有效地利用大型语言模型(LLM)变得越来越重要。然而,有许多不同的方式可以使用大型语言模型,这可能会让我们感到困惑。

2024-07-22 11:16:03 655

原创 大语言模型(LLM)产品开发流程清单

这篇文章讲介绍个人开发者和组织级别的大语言模型(LLM)产品开发流程参考。

2024-07-21 09:15:00 789

原创 从 RAG 1.0到RAG 2.0,这次做对了什么?

RAG是目前最流行的补充生成式人工智能模型的方式,最近 RAG 的开创者提出了新的上下文语言模型 (CLM) ,他们称之为“ **RAG 2.0** ”。

2024-07-20 09:15:00 597

原创 产品经理必须懂得AI:prompts提示工程之五大经典框架

在数字化时代,了解AI提示词工程,有助于设计更智能的交互,优化产品功能,提升用户体验。本文总结了prompts提示工程之五大经典框架,希望对你有所启发。

2024-07-19 16:37:10 365

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除