- 博客(901)
- 收藏
- 关注
原创 LLM下半场之Agent基础能力概述:Profile、Memory、Plan、Action、Eval学习笔记
Agent的概念是创造一个个场景的智能体,可以在某些领域,比如在社会分析、电商导购、工业制造方面提供解决方案。LLM的发展将会让Agent的诞生成为可能,也会推动各个领域的Agent发展,所以我说Agent将会是LLM的下半场。
2024-09-14 09:38:49 757
原创 Prompt提示词调优工具介绍-ChainForge
在人工智能和自然语言处理领域,大型语言模型(LLM)的兴起为各行各业带来了巨大变革。然而,如何有效地评估和优化这些模型的输出一直是一个挑战。为了解决这个问题,来自哈佛大学人机交互实验室的研究人员开发了ChainForge - 一个开源的可视化工具包,旨在简化提示词工程及评估测试的过程。
2024-09-14 09:19:43 387
原创 大模型书籍丨人大赵鑫教授出书《大语言模型》,第一本中文大语言模型教程!
今年4月中旬, 人大赵鑫教授出书了《大语言模型》一书, 作为第一本中文大语言模型教程, 立刻引起广泛关注, 该书内容偏综述性, 非常系统性地介绍了大语言模型的基本原理、核心技术和研究进展, 对于了解大语言模型的全貌会有非常好的帮助。
2024-09-12 14:39:14 675
原创 大模型书籍丨Dennis Rothman 大模型黑书无敌!强烈推荐
大模型黑书,Dennis Rothman的大作。 就是下图这本书,出版后受到很多赞誉,也是很多人都推荐的读物。
2024-09-12 14:33:44 260
原创 《开源大模型食用指南》,一杯奶茶速通大模型!新增Examples最佳实践!
Self-llm 开源项目是一个围绕开源大模型、针对国内初学者、适合中国宝宝的专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
2024-09-09 14:14:40 831
原创 大语言模型应用指南:以GPT为起点,从入门到精通的AI实践教程
在20世纪末和21世纪初,人类经历了两次信息革命的浪潮。然而,随着技术的不断演进和人类社会的不断发展,我们正站在另一个信息时代的门槛上。这是一个更加智能化、更加联系紧密的时代,它将重新定义我们与世界互动的方式,塑造我们的生活、工作和社会关系。2022年11月30日,OpenAI发布了ChatGPT⸺一个基于生成式预训练Transformer (Generative Pre-trained Transformer,GPT)技术的语言模型。
2024-09-08 08:00:00 662
原创 分享轩辕大模型的实践与应用
在人工智能的浪潮中,大模型正以其独特的方式重塑金融科技的未来。在4月26日的2024年全球机器学习技术大会上,作为度小满数据智能部总经理和技术委员会执行主席,本人有幸代表团队分享了轩辕大模型在金融行业的实践与应用。
2024-09-07 06:45:00 1483
原创 【LLM大模型】如何系统的从0到1学习大模型?相关书籍及课程那些比较好?
大模型入门不可错过的一本书,就是这本大模型界的经典畅销书 《大规模语言模型》 !系统性强,内容适合初学者,如果你想知道如何构建一个大模型应用,系统了解大模型的构建,选它准没错!
2024-09-06 14:03:01 841
原创 LLM大模型好书分析:大模型黑书优缺点客观分析!
大模型黑书,Dennis Rothman的大作。 就是下图这本书,出版后受到很多赞誉,也是很多人都推荐的读物。
2024-09-06 13:58:01 600
原创 如何系统的从0到1学习大模型?这两本大模型书籍太香了
个人比较推荐的是两本关于大模型的书:《大模型应用解决方案》和《快速部署大模型》。这两本书关于上述知识都有完整的覆盖及详细的讲解,这两本书相辅相成,前者主要围绕一系列经典Transformer模型,以项目制的方式开展知识讲解;后者则补充了大语言模型(LLM)最新的前沿技术。
2024-09-06 13:49:08 405
原创 大模型入门:Mistral 大语言模型
Mistral AI 是一家销售人工智能产品的法国公司。它由 Meta Platforms 和 Google DeepMind 的前员工于 2023 年 4 月创立。该公司于 2023 年 10 月筹集了 3.85 亿欧元,2023 年 12 月估值超过 20 亿美元
2024-09-05 14:34:40 1059
原创 LLM大语言模型应用框架介绍
大语言模型的英文全称为:Large Language Model,缩写为 LLM,也被称为大型语言模型,主要指的是在大规模文本语料上训练、包含百亿级别参数的语言模型,它用来做自然语言相关任务的深度学习模型。
2024-09-05 14:28:51 763
原创 LLM大模型应用设计思考:大模型+bi,TFlowAI如何让大模型来检索数据
TFlowAI提出了一种基于大模型的解决方案,通过理解业务、查找数据、分析处理的过程编排,实现模型自主的基于数据库的数据查询与分析。这种方法不仅降低了开发成本,还提升了使用体验。
2024-09-04 14:54:11 771
原创 随着AI产品的逐渐出现是否应该焦虑
本文将从AI对就业市场的影响、隐私与安全挑战以及如何积极利用AI带来的机遇等角度出发,探讨如何在保证安全和伦理的前提下,最大化利用AI技术的优势。
2024-09-04 14:51:19 814
原创 大模型书籍推荐丨这本大模型权威教材必看!大模型私有化部署真不难(附PDF)
《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。
2024-09-02 15:37:01 889
原创 大模型agent开发之提示词选择器
有时候单一的提示词模版无法满足复杂的任务需求,因此需要结合选择器使大模型有更加准确的判断,尤其是在高度上下文依赖性的对话或生成任务时,动态的选择最合适的示例或者提示词时尤其重要。
2024-09-02 15:35:30 977
原创 国产大模型王炸发布!API 正式免费用,第一手token白嫖分析
今日,智谱 BigModel 开放平台正式宣布:GLM-4-Flash 全部免费,同时开启限时免费微调活动。
2024-08-28 14:58:21 986
原创 【ChatGLM】终于!智谱GLM-4-9B 支持 Ollama 部署
GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中, GLM-4-9B 在各项能力上均表现出卓越的能力。
2024-08-28 14:44:37 1119
原创 大模型如何生成可控文本?人大等最新《大型语言模型的可控文本生成》综述
在自然语言处理(NLP)领域,大型语言模型(LLMs)已展示出高质量的文本生成能力。然而,在实际应用中,LLMs必须满足日益复杂的需求。除了避免生成误导性或不恰当的内容外,LLMs还需要满足特定用户的需求,例如模仿特定的写作风格或生成具有诗意丰富性的文本。
2024-08-26 15:12:11 664
原创 8月最新大语言模型新书!赵宇教授《自然语言处理:大模型理论与实践》449页pdf!
在当今的人工智能时代,NLP技术已经深入渗透到我们日常生活的各个方面,从智能助手、语音识别到机器翻译和文本生成,NLP正在以令人瞩目的速度改变着我们的生活方式。
2024-08-26 15:08:11 396
原创 小白学大模型:GLM api调用教程
在这里,你会发现丰富的 代码示例👨、实用指南🗺️ 以及 资源链接🔗,或许能帮助你轻松掌握 GLM API 的使用!
2024-08-23 16:26:18 865
原创 小白学大模型:LLaMA-Factory 介绍与使用
LLaMA-Factory是一个统一的框架,集成了一套先进的高效训练方法。它允许用户通过内置的Web UI灵活定制100多个LLMs的微调,而无需编写代码。
2024-08-23 16:20:36 918
原创 LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设
模型越来越大,需要的 GPU 越来越多;与此同时 GPU 性能也在不断增强,配套的网络带宽也不断增加到 400G(Blackwell GPU 甚至需要到 800 Gbps)。
2024-08-22 20:27:22 852
原创 Llama 3.1对我国AIGC产业发展的启示
我国开源大模型的发展还存在一些差距和不足。因此,有必要深入研究Llama3.1的发布,探讨其对我国开源大模型发展的启示。
2024-08-22 20:22:19 690
原创 如何优化ChatGLM-6B?一行代码就行 | 最“in”大模型
ChatGPT 的横空出世开启了大语言模型 (LLM) 的普及元年,BERT、GPT-4、ChatGLM 等模型的非凡能力则展现出类似通用人工智能 (AI) 的巨大潜力,也因此得到了多行业、多领域的广泛关注。
2024-08-20 16:17:30 663
原创 【RAG】FastEmbed:一种轻量的快速文本嵌入工具
在进行文本嵌入时,尤其是RAG**系统,有一个快速高效的文本嵌入工具是非常有必要的。因此,FastEmbed设计目标是提升计算效率,同时保持嵌入表示的质量。此外,FastEmbed还支持一些图像嵌入模型。
2024-08-20 16:09:05 895
原创 Prompt“提示工程”的技术分类
通过提示工程技术,我们可以引入更多的时间和空间以及内容的属性,有助于更好地生成提示词。那么,提示工程技术有哪些呢?我们如何更好地使用它们呢?
2024-08-18 08:15:00 732
原创 LLM大模型应用框架:LangChain与LlamaIndex的对比选择
在《解读LangChain》一文中,老码农曾对LangChain 做个一些探索,这里重新回顾一下LangChain 的主要特点以及优势与局限。
2024-08-17 07:30:00 1622
原创 【LLM大模型】打造领域专属的大语言模型
大模型具有生成和理解自然语言的强大能力,但在专属领域中,通用模型往往表现不尽如人意。为了解决这一问题,越来越多的人希望能够使用基于专业或行业领域的大语言模型,以提高回答问题的准确性。
2024-08-16 10:32:16 962
原创 介绍大语言模型(LLM)
人工智能(AI)和自然语言处理(NLP)领域取得了显著的进展,其中大语言模型(Large Language Models,简称LLM)成为了引人注目的焦点。大语言模型是基于深度学习技术训练的,可以理解和生成自然语言文本的AI模型。本文将介绍大语言模型的基本概念、发展历程、应用领域以及未来的潜力。
2024-08-16 10:28:56 397
原创 这本Transformer书红的发紫,浅显易懂掌握大模型NLP技术!(附文档)
这本Transformer书红的发紫,浅显易懂掌握大模型NLP技术!(附文档)
2024-08-15 17:21:46 422
原创 Llama 3.1 重磅发布,登顶开源大模型王座!
7月23日,Meta正式发布迄今为止最强大的开源模型——Llama 3.1 405B,同时发布了全新升级的Llama 3.1 70B和8B模
2024-08-15 17:21:14 569
原创 【AI Agent】入门,看这一篇就够了!
AI Agent技术正重塑我们的未来工作与生活。本文深入探索了AI Agent构建平台的奥秘,从概念理解到功能剖析,再到国内外平台的全面盘点,带领读者领略这一变革性技术的魅力。
2024-08-14 19:59:26 713
原创 学习AI大模型的3件事你必须知道,业内知识,速看
在AI技术迅速发展的时代,产品经理的工作似乎面临挑战,但个人沟通和复杂决策依然是AI难以完全承担的任务。
2024-08-14 19:53:00 779
原创 介绍大语言模型(LLM)
近年来,人工智能(AI)和自然语言处理(NLP)领域取得了显著的进展,其中大语言模型(Large Language Models,简称LLM)成为了引人注目的焦点。大语言模型是基于深度学习技术训练的,可以理解和生成自然语言文本的AI模型。本文将介绍大语言模型的基本概念、发展历程、应用领域以及未来的潜力。
2024-08-13 21:37:54 742
原创 LLM大模型在金融领域的综述
本综述调查了大语言模型(LLM)在金融领域的应用,重点关注现有解决方案。我们回顾了利用预训练模型、微调特定领域数据以及从头开始训练定制LLM的方法,为金融专业人士根据数据、计算和性能需求选择合适的LLM解决方案。最后,我们讨论了金融应用中利用LLM的局限性和挑战,为金融人工智能提供路线图。
2024-08-13 21:28:46 857
原创 LLM大模型开源RAG框架汇总
本文搜集了一些开源的基于LLM的RAG(Retrieval-Augmented Generation)框架,旨在吸纳业界最新的RAG应用方法与思路。如有错误或者意见可以提出,同时也欢迎大家把自己常用而这里未列出的框架贡献出来,感谢~
2024-08-12 21:01:47 746
原创 LLM大模型外挂知识库
我们知道,ChatGPT回答的数据来自于训练的数据(如现在是截止到2022年的数据),不能使用其他数据,但需要大模型根据特定的数据源来回答时问题时,该怎么办呢?
2024-08-12 20:55:53 617
原创 吴恩达+OpenAI:面向大模型入门的 LLM CookBook 汉化版(附文档)
这次给大家推荐的是AI圈无人不知的吴恩达大佬+OpenAI团队一起编写的大模型入门文档,也就是这本:大型语言模型(LLM)的权威文档
2024-08-10 10:11:21 736
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人