自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(895)
  • 收藏
  • 关注

原创 大语言模型应用指南:以GPT为起点,从入门到精通的AI实践教程

在20世纪末和21世纪初,人类经历了两次信息革命的浪潮。然而,随着技术的不断演进和人类社会的不断发展,我们正站在另一个信息时代的门槛上。这是一个更加智能化、更加联系紧密的时代,它将重新定义我们与世界互动的方式,塑造我们的生活、工作和社会关系。2022年11月30日,OpenAI发布了ChatGPT⸺一个基于生成式预训练Transformer (Generative Pre-trained Transformer,GPT)技术的语言模型。

2024-09-08 08:00:00 245

原创 分享轩辕大模型的实践与应用

在人工智能的浪潮中,大模型正以其独特的方式重塑金融科技的未来。在4月26日的2024年全球机器学习技术大会上,作为度小满数据智能部总经理和技术委员会执行主席,本人有幸代表团队分享了轩辕大模型在金融行业的实践与应用。

2024-09-07 06:45:00 981

原创 【LLM大模型】如何系统的从0到1学习大模型?相关书籍及课程那些比较好?

大模型入门不可错过的一本书,就是这本大模型界的经典畅销书 《大规模语言模型》 !系统性强,内容适合初学者,如果你想知道如何构建一个大模型应用,系统了解大模型的构建,选它准没错!

2024-09-06 14:03:01 653

原创 LLM大模型好书分析:大模型黑书优缺点客观分析!

大模型黑书,Dennis Rothman的大作。 就是下图这本书,出版后受到很多赞誉,也是很多人都推荐的读物。

2024-09-06 13:58:01 521

原创 如何系统的从0到1学习大模型?这两本大模型书籍太香了

个人比较推荐的是两本关于大模型的书:《大模型应用解决方案》和《快速部署大模型》。这两本书关于上述知识都有完整的覆盖及详细的讲解,这两本书相辅相成,前者主要围绕一系列经典Transformer模型,以项目制的方式开展知识讲解;后者则补充了大语言模型(LLM)最新的前沿技术。

2024-09-06 13:49:08 296

原创 大模型入门:Mistral 大语言模型

Mistral AI 是一家销售人工智能产品的法国公司。它由 Meta Platforms 和 Google DeepMind 的前员工于 2023 年 4 月创立。该公司于 2023 年 10 月筹集了 3.85 亿欧元,2023 年 12 月估值超过 20 亿美元

2024-09-05 14:34:40 1032

原创 LLM大语言模型应用框架介绍

大语言模型的英文全称为:Large Language Model,缩写为 LLM,也被称为大型语言模型,主要指的是在大规模文本语料上训练、包含百亿级别参数的语言模型,它用来做自然语言相关任务的深度学习模型。

2024-09-05 14:28:51 747

原创 LLM大模型应用设计思考:大模型+bi,TFlowAI如何让大模型来检索数据

TFlowAI提出了一种基于大模型的解决方案,通过理解业务、查找数据、分析处理的过程编排,实现模型自主的基于数据库的数据查询与分析。这种方法不仅降低了开发成本,还提升了使用体验。

2024-09-04 14:54:11 758

原创 随着AI产品的逐渐出现是否应该焦虑

本文将从AI对就业市场的影响、隐私与安全挑战以及如何积极利用AI带来的机遇等角度出发,探讨如何在保证安全和伦理的前提下,最大化利用AI技术的优势。

2024-09-04 14:51:19 801

原创 大模型书籍推荐丨这本大模型权威教材必看!大模型私有化部署真不难(附PDF)

《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。

2024-09-02 15:37:01 879

原创 大模型agent开发之提示词选择器

有时候单一的提示词模版无法满足复杂的任务需求,因此需要结合选择器使大模型有更加准确的判断,尤其是在高度上下文依赖性的对话或生成任务时,动态的选择最合适的示例或者提示词时尤其重要。

2024-09-02 15:35:30 963

原创 国产大模型王炸发布!API 正式免费用,第一手token白嫖分析

今日,智谱 BigModel 开放平台正式宣布:GLM-4-Flash 全部免费,同时开启限时免费微调活动。

2024-08-28 14:58:21 976

原创 【ChatGLM】终于!智谱GLM-4-9B 支持 Ollama 部署

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中, GLM-4-9B 在各项能力上均表现出卓越的能力。

2024-08-28 14:44:37 1084

原创 大模型如何生成可控文本?人大等最新《大型语言模型的可控文本生成》综述

在自然语言处理(NLP)领域,大型语言模型(LLMs)已展示出高质量的文本生成能力。然而,在实际应用中,LLMs必须满足日益复杂的需求。除了避免生成误导性或不恰当的内容外,LLMs还需要满足特定用户的需求,例如模仿特定的写作风格或生成具有诗意丰富性的文本。

2024-08-26 15:12:11 631

原创 8月最新大语言模型新书!赵宇教授《自然语言处理:大模型理论与实践》449页pdf!

在当今的人工智能时代,NLP技术已经深入渗透到我们日常生活的各个方面,从智能助手、语音识别到机器翻译和文本生成,NLP正在以令人瞩目的速度改变着我们的生活方式。

2024-08-26 15:08:11 381

原创 小白学大模型:GLM api调用教程

在这里,你会发现丰富的 代码示例👨‍、实用指南🗺️ 以及 资源链接🔗,或许能帮助你轻松掌握 GLM API 的使用!

2024-08-23 16:26:18 846

原创 小白学大模型:LLaMA-Factory 介绍与使用

LLaMA-Factory是一个统一的框架,集成了一套先进的高效训练方法。它允许用户通过内置的Web UI灵活定制100多个LLMs的微调,而无需编写代码。

2024-08-23 16:20:36 903

原创 LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设

模型越来越大,需要的 GPU 越来越多;与此同时 GPU 性能也在不断增强,配套的网络带宽也不断增加到 400G(Blackwell GPU 甚至需要到 800 Gbps)。

2024-08-22 20:27:22 820

原创 Llama 3.1对我国AIGC产业发展的启示

我国开源大模型的发展还存在一些差距和不足。因此,有必要深入研究Llama3.1的发布,探讨其对我国开源大模型发展的启示。

2024-08-22 20:22:19 684

原创 如何优化ChatGLM-6B?一行代码就行 | 最“in”大模型

ChatGPT 的横空出世开启了大语言模型 (LLM) 的普及元年,BERT、GPT-4、ChatGLM 等模型的非凡能力则展现出类似通用人工智能 (AI) 的巨大潜力,也因此得到了多行业、多领域的广泛关注。

2024-08-20 16:17:30 659

原创 【RAG】FastEmbed:一种轻量的快速文本嵌入工具

在进行文本嵌入时,尤其是RAG**系统,有一个快速高效的文本嵌入工具是非常有必要的。因此,FastEmbed设计目标是提升计算效率,同时保持嵌入表示的质量。此外,FastEmbed还支持一些图像嵌入模型。

2024-08-20 16:09:05 887

原创 Prompt“提示工程”的技术分类

通过提示工程技术,我们可以引入更多的时间和空间以及内容的属性,有助于更好地生成提示词。那么,提示工程技术有哪些呢?我们如何更好地使用它们呢?

2024-08-18 08:15:00 725

原创 LLM大模型应用框架:LangChain与LlamaIndex的对比选择

在《解读LangChain》一文中,老码农曾对LangChain 做个一些探索,这里重新回顾一下LangChain 的主要特点以及优势与局限。

2024-08-17 07:30:00 1601

原创 【LLM大模型】打造领域专属的大语言模型

大模型具有生成和理解自然语言的强大能力,但在专属领域中,通用模型往往表现不尽如人意。为了解决这一问题,越来越多的人希望能够使用基于专业或行业领域的大语言模型,以提高回答问题的准确性。

2024-08-16 10:32:16 956

原创 介绍大语言模型(LLM)

人工智能(AI)和自然语言处理(NLP)领域取得了显著的进展,其中大语言模型(Large Language Models,简称LLM)成为了引人注目的焦点。大语言模型是基于深度学习技术训练的,可以理解和生成自然语言文本的AI模型。本文将介绍大语言模型的基本概念、发展历程、应用领域以及未来的潜力。

2024-08-16 10:28:56 396

原创 这本Transformer书红的发紫,浅显易懂掌握大模型NLP技术!(附文档)

这本Transformer书红的发紫,浅显易懂掌握大模型NLP技术!(附文档)

2024-08-15 17:21:46 419

原创 Llama 3.1 重磅发布,登顶开源大模型王座!

7月23日,Meta正式发布迄今为止最强大的开源模型——Llama 3.1 405B,同时发布了全新升级的Llama 3.1 70B和8B模

2024-08-15 17:21:14 567

原创 【AI Agent】入门,看这一篇就够了!

AI Agent技术正重塑我们的未来工作与生活。本文深入探索了AI Agent构建平台的奥秘,从概念理解到功能剖析,再到国内外平台的全面盘点,带领读者领略这一变革性技术的魅力。

2024-08-14 19:59:26 660

原创 学习AI大模型的3件事你必须知道,业内知识,速看

在AI技术迅速发展的时代,产品经理的工作似乎面临挑战,但个人沟通和复杂决策依然是AI难以完全承担的任务。

2024-08-14 19:53:00 772

原创 介绍大语言模型(LLM)

近年来,人工智能(AI)和自然语言处理(NLP)领域取得了显著的进展,其中大语言模型(Large Language Models,简称LLM)成为了引人注目的焦点。大语言模型是基于深度学习技术训练的,可以理解和生成自然语言文本的AI模型。本文将介绍大语言模型的基本概念、发展历程、应用领域以及未来的潜力。

2024-08-13 21:37:54 740

原创 LLM大模型在金融领域的综述

本综述调查了大语言模型(LLM)在金融领域的应用,重点关注现有解决方案。我们回顾了利用预训练模型、微调特定领域数据以及从头开始训练定制LLM的方法,为金融专业人士根据数据、计算和性能需求选择合适的LLM解决方案。最后,我们讨论了金融应用中利用LLM的局限性和挑战,为金融人工智能提供路线图。

2024-08-13 21:28:46 835

原创 LLM大模型开源RAG框架汇总

本文搜集了一些开源的基于LLM的RAG(Retrieval-Augmented Generation)框架,旨在吸纳业界最新的RAG应用方法与思路。如有错误或者意见可以提出,同时也欢迎大家把自己常用而这里未列出的框架贡献出来,感谢~

2024-08-12 21:01:47 693

原创 LLM大模型外挂知识库

我们知道,ChatGPT回答的数据来自于训练的数据(如现在是截止到2022年的数据),不能使用其他数据,但需要大模型根据特定的数据源来回答时问题时,该怎么办呢?

2024-08-12 20:55:53 599

原创 吴恩达+OpenAI:面向大模型入门的 LLM CookBook 汉化版(附文档)

这次给大家推荐的是AI圈无人不知的吴恩达大佬+OpenAI团队一起编写的大模型入门文档,也就是这本:大型语言模型(LLM)的权威文档

2024-08-10 10:11:21 716

原创 最清晰解读大模型提示工程(Prompt Engineering)(附教程)

提示工程(Prompt Engineering),也称为上下文提示,是一种通过不更新模型的权重/参数来引导LLM行为朝着特定结果的方法。这是与AI有效交流所需结果的过程。提示工程可以用于各种任务,从回答问题到算术推理乃至各种应用领域,理解提示工程,能够帮助我们了解LLM的限制和能力。

2024-08-10 10:09:24 1182

原创 【AI大模型】2023医疗健康AI大模型行业研究报告

随着技术成熟度以及数据可用性增加,医疗健康AI大模型对医疗场景中(如药物发现、个性化医疗、医学影像、数据增强)的部分研发阻碍给出解决方案,加快医疗研发速度。

2024-08-08 20:50:28 214

原创 【LLM大模型】一份在阿里内网悄悄流传的大模型面试真题!(2024年最新)

随着人工智能技术的迅猛发展,计算机视觉(CV)、自然语言处理(NLP)、搜索、推荐、广告推送和风险控制等领域的岗位越来越受欢迎,而对于大型模型技术的掌握成为了这些岗位的标配。

2024-08-08 20:20:31 638

原创 最强开源大模型炸场!全网独一份AI大模型学习实践资源...(待会删)

最强开源大模型炸场!全网独一份AI大模型学习实践资源...(待会删)

2024-08-07 22:04:35 716

原创 LLM大模型: RAG两大核心利器 — embedding和reranker模型微调fine-tune

要想RAG好,embedding和reranker必须给力!目前市面上流行的embedding和reranker使用的都是通用预料训练,并未针对安全这个细分领域定制,所以有必要使用安全领域的预料微调一下!

2024-08-06 17:50:41 1230

原创 【AI大模型】大语言模型的应用探索—AI Agent初探!

AI Agent是人工智能代理(Artificial Intelligence Agent)的概念,它是一种能够感知环境、进行决策和执行动作的智能实体,通常基于机器学习和人工智能技术,具备自主性和自适应性,在特定任务或领域中能够自主地进行学习和改进。

2024-08-06 17:46:12 1016

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除