自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(259)
  • 收藏
  • 关注

原创 推荐收藏!九大最热门的开源大模型 Agent 框架来了

在人工智能领域,AI Agent 扮演着关键角色,能够模拟人类的智能行为。近年来,开源社区涌现出多个优秀的 AI Agent 框架,本文将介绍九种备受关注的开源AI Agent框架,包括AutoGPT、AutoGen、Langfuse、ChatDev、BabyAGI、CAMEL、SuperAGI、MetaGPT和ShortGPT。这些框架为开发者提供了丰富的资源和工具,为智能应用的开发和创新提供了强大支持。

2024-07-13 10:20:22 786

原创 从零开始创建基于LLM的Agent

此次比赛是阿里云举办的AI创意挑战赛,主旨是设计能够完成一定任务的AI Agent,创作出受欢迎的Agent产品。本次比赛我们会调用开源的通义千问大模型api作为LLM大脑,通过设计Prompt为LLM设定角色,确定LLM的功能,以及自行的创建或者调用第三方的tool,让Agent实现更多的功能。Prompt是一段文字或代码片段,用于与语言模型进行交互。它是一种启发式的工具,通过提供明确的指令或问题,引导模型生成相关的文本。在Agent构建中,prompt的设计影响了模型对任务的理解和执行方式。我构建了。

2024-07-13 10:19:29 358

原创 多模态大模型时代下的文档图像智能分析与处理_多模态ocr

随着人工智能技术的不断发展,尤其是深度学习技术的广泛应用,多模态数据处理和大模型训练已成为当下研究的热点之一,这些技术也为文档图像智能处理和分析领域带来了新的发展机遇。多模态大模型时代下的文档图像智能分析与处理的研究旨在通过运用多种数据类型,如文本、图像、音频等,并借助大规模深度学习模型的训练,来实现对文档图像内容的更加准确和全面的理解和分析。综合使用多模态数据训练大模型可以极大地提高文档图像处理和分析的效率和精度,进而推动相关行业的数字化转型和智能化升级。

2024-07-13 10:18:37 587

原创 直观易用的大模型开发框架LangChain,你会了没?

在今年的敏捷团队建设中,我通过Suite执行器实现了一键自动化单元测试。Juint除了Suite执行器还有哪些执行器呢?由此我的Runner探索之旅开始了!LangChain 作为一个大语言模型(LLM)集成框架,旨在简化使用大语言模型的开发过程,包括如下组件:

2024-07-13 10:17:58 445

原创 这本书太好了!150页就能让你上手大模型应用开发(免费分享PDF)

如果问个问题:有哪些产品曾经创造了伟大的奇迹?ChatGPT 应该会当之无愧入选。仅仅发布 5 天,ChatGPT 就吸引了 100 万用户——当然,数据不是关键,关键是其背后的技术开启了新的 AI 狂潮,成为技术变革的点火器。就算我们这些周边吃瓜群众都日日活在 ChatGPT 带来的震撼里,更不用说在 AI 领域摸爬滚打的专家们了。

2024-07-13 10:17:24 437

原创 科普神文,一次性讲透AI大模型的核心概念

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。令牌,向量,嵌入,注意力,这些AI大模型名词是否一直让你感觉熟悉又陌生,如果答案肯定的话,那么朋友,今天这篇科普神文不容错过。理解了LLM基础数学原理和模型概念抽象后,大家是不是很兴奋,最后让我们看看目前世界上最先的大预言模型到底做了什么,构建了如此缤纷多彩的AI应用世界。帮助很多人得到了学习和成长。

2024-07-12 10:34:23 633

原创 清华博士带你掌握 Llama 大模型 40 节课助你涨薪 120%

学习 AI 大模型 已成就业抓手目前互联网行业的就业形式呈现多元化态势,为各类人才提供了丰富的舞台。随着就业人口的逐年攀升,就业形势和就业缺口却日趋严峻。但是数字市场化标准在不断攀升,对新型数字人才技术要求在持续提高。在这个 AI 技术日新月异的时代,掌握 AI 大模型 的学习已成为当务之急!大模型技术已经成为了一个不可或缺的技能!掌握大模型技术,就意味着您将能够在未来的职业发展道路上走得更远,解锁更多的可能性。

2024-07-12 10:33:32 491

原创 Spring AI 接入OpenAI大模型实现同步和流式对话

Spring AI中流式对话接口采用的是Spring WebFlux异步网络框架实现的,WebFlux底层默认采用Netty,因此,如果需要了解Spring AI流式对话底层的实现,则需要对异步网络编程有一定的了解。虽然接入简单,但是如果想用好大模型还是有一定的难度的,比如怎么使用提示词工程激发大模型的能力,让回答更准确,如何给大模型执行一个角色以及如何让大模型具有上下文记忆能力等等。Spring AI 支持使用。支持的大模型以及需要引入的依赖包,大家根据需求自行进行选择所需要的大模型,实现对话功能。

2024-07-12 10:32:26 644

原创 全方位解析:现象级AI大模型热潮

在聊到AI的时候,我们都离不开“大模型”这三个字。AI大模型已经完全融入了各个领域,也融入了我们的生活,它好像无所不在、无所不能。百度李彦宏说 :大模型改变世界;360周鸿祎说:大模型是新时代“发电厂”;李开复博士说:AI大模型是不能错过的历史机遇;……那么,究竟什么是大模型?今天我想和你深度聊聊,从概念到技术,从发展到未来,讲大模型剖析透彻,更好地看清未来方向。欢迎和我链接,一起探讨大模型的更多可能性。《中国AI大模型发展白皮书研究报告》

2024-07-12 10:31:36 626

原创 20K star!手把手教会你搞定 LLM 微调,超详细收藏我这篇就够了

LLM(大语言模型)微调一直都是老大难问题,不仅因为微调需要大量的计算资源,而且微调的方法也很多,要去尝试每种方法的效果,需要安装大量的第三方库和依赖,甚至要接入一些框架,可能在还没开始微调就已经因为环境配置而放弃了。今天我们分享一个开源项目可以快速进行 LLM 微调,它不单运行效率高,而且还可以在微调过程中进行可视化,非常方便,它就是:LLaMA Factory。

2024-07-12 10:30:53 696

原创 AI大模型企业应用实战:Prompt让LLM理解知识

我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。无具体指令,模型只会续写。

2024-07-11 11:13:55 225

原创 在 AI 公司入职一个月的体验与感悟

已经在一家 AI 公司入职了一个月,对坐班有些厌恶的我,没想到有一天也会开始通勤打卡。而经历了这一个月的工作,我对坐班的态度有所转变,开始理解这种工作方式对我的意义。是时候分享入职这期间的工作内容与感受。

2024-07-11 11:13:08 340

原创 十年磨一剑:AI大模型企业知识库搭建秘籍

在AI大模型的赋能下,企业知识库正迎来前所未有的发展机遇。通过深入理解知识库的价值、选择合适的AI大模型、制定合理的建设步骤和策略以及持续优化和维护知识库,我们可以打造一个高效、智能、安全的企业知识库,为企业的发展提供有力支持。希望我的分享能够为您在企业知识库建设过程中提供有益的参考和帮助。

2024-07-11 11:12:30 407

原创 大模型携手金融业:驱动未来发展的创新融合趋势

在数字化浪潮席卷全球的今天,金融与大模型的结合正成为行业发展的新引擎。这种融合不仅为金融机构带来了前所未有的效率和准确性,也为金融市场的稳定与发展注入了新的活力。本文将基于当前的市场现状,结合金融环境的发展,深入分析金融与大模型相结合的发展所在,并宣扬大模型的优势和大势所趋。金融与大模型的结合是行业发展的必然趋势,也是金融行业实现数字化转型和创新发展的关键。面对这一机遇和挑战并存的局面,我们应积极拥抱变革、勇于创新实践。

2024-07-11 11:11:39 294

原创 大模型时代,什么样的算法工程师更吃香?

大模型是数据、算法和算力的完美实践,是科研、工程和组织的优雅艺术。大模型时代的算法工程师,视野应当更加广阔,技能树应当更加枝繁叶茂、更加平衡。从整个社会生产效率的角度来说,“中央厨房预制菜”模式势不可挡。既然如此,那些沉溺于自怨自艾、慨叹“世风日下”的厨子,注定将被市场边缘化。而那些有着扎实烹饪技艺,同时积极适应标准化的配菜流程、勇于探索烹饪工艺创新、在预制菜品二次加工、顾客口味洞察、团队合作以及品控等方面迅速补全能力的厨子,必将在更加广阔的舞台上大放异彩。

2024-07-11 11:09:51 324

原创 零代码本地搭建AI大模型,详细教程!普通电脑也能流畅运行,中文回答速度快,回答质量高

这篇教程主要解决:1). 有些读者朋友,,比如电脑没有配置GPU显卡,还想在本地使用AI;2). Llama3回答中文问题欠佳,更强的AI大模型。3). 想成为AI开发者,开发一款AI大模型的应用和产品,如何选择API的问题。我相信,大家平时主要还是以中文问答为主,安装一个中文回答更强的AI,就显得更很有必要。这篇教程。1 通义千问大模型的优势近日阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为。

2024-07-10 10:24:31 924

原创 AI 大模型训练中,通常会采用哪些方法?(输入篇)

某种程度来说大模型训练的核心算法就是300到400行代码,如果真正理解了并不难。下面我将带大家分析常规大模型训练有几个阶段以及在训练中一般会用到哪些方法。由上图可以看出,大模型训练主要有四个阶段:预训练、有监督微调、奖励建模、强化学习。开始的第一个阶段是预训练阶段。这个阶段在这个图中有点特殊,因为这个图没有按比例缩放。实际上预训练消耗的时间占据了整个训练pipeline的99%。因此,这个阶段就是我们在超级计算机中使用数千个GPU以及数月的训练来处理互联网规模数据集的地方。

2024-07-10 10:23:42 1039

原创 LLM对程序员的冲击和影响

1LLM 在软件开发过程中的单点提效。真的是这样吗?要回答这个问题,我们需要从全局来看问题,首先我们要搞清楚,LLM 对于软件研发,什么变了?什么没有变?2LLM 对于软件研发,什么变了?。以前工程师个体学习掌握一门计算机语言以及相应的数据结构和算法,需要较长的学习周期,很多经验和模式还需要工程师个体在大量实践中进行总结,每个工程师个体都在重复着这个过程,现在 LLM 让一个没有接受过系统培训的个体也能拥有同样的能力,个体和个体之间的能力差异被 LLM 拉平了,这就是。如果说。

2024-07-10 10:21:18 966

原创 LLM 盛行,如何优雅地训练大模型?

ChatGPT于2022年12月初发布,震惊轰动了全世界,发布后的这段时间里,一系列国内外的大模型训练开源项目接踵而至,例如Alpaca、BOOLM、LLaMA、ChatGLM、DeepSpeedChat、ColossalChat等。不论是学术界还是工业界,都有训练大模型来优化下游任务的需求。

2024-07-10 10:20:14 805

原创 LangChain技术解密:构建大模型应用的全景指南

LangChain是一个专为大语言模型(LLM)设计的开源框架,旨在简化复杂应用的开发流程。它提供了一套完善的工具和API,帮助开发者更轻松地集成和管理大语言模型。LangChain的设计初衷是通过模块化和可扩展的方式,使得开发者可以根据具体需求自由组合和扩展功能,从而更高效地实现应用目标。

2024-07-10 10:19:28 968

原创 大模型微调方法总结

自然语言处理目前存在一个重要范式:一般领域数据的大规模预训练,对特定任务或领域的适应(finetune)。但是随着预训练语言模型越来越大,这个范式存在以下问题:● 当我们 finetune 大模型时,由于训练成本太高,不太可能重新训练所有模型参数● 以前的方法(论文发表于 2021 年)都或多或少有其它性能问题,如 adapter 增加了模型层数,引入了额外的推理延迟;prefix-tuning 比较难训练,效果不如直接 finetune。

2024-07-09 10:47:44 514

原创 中国大模型落地进展如何?

在ChatGPT爆发之后,国内外科技赛道都被掀起了巨大波澜,随后在国内这段时间里,大量的大模型争先恐后地出现。那么截止到现在,大模型在国内土壤落地得怎么样了?一起来看看本文的解读。距离ChatGPT爆发的那一天,已经过去8个月了。8个月的时间,中国诸多大模型拔地而起,以飞快的速度,不断向各个行业场景渗透。但就目前为止,并未出现真正被大模型颠覆的场景或行业。统计数据显示,在大模型落地应用中,一个值得被看见的问题是:如今在中国的土壤里,大模型的落地进展究竟如何?

2024-07-09 10:45:16 785

原创 中国大模型落地进展如何?

在ChatGPT爆发之后,国内外科技赛道都被掀起了巨大波澜,随后在国内这段时间里,大量的大模型争先恐后地出现。那么截止到现在,大模型在国内土壤落地得怎么样了?一起来看看本文的解读。距离ChatGPT爆发的那一天,已经过去8个月了。8个月的时间,中国诸多大模型拔地而起,以飞快的速度,不断向各个行业场景渗透。但就目前为止,并未出现真正被大模型颠覆的场景或行业。统计数据显示,在大模型落地应用中,一个值得被看见的问题是:如今在中国的土壤里,大模型的落地进展究竟如何?

2024-07-09 10:43:11 616

原创 大模型落地应用正在改变云计算行业的竞争

目前,大模型在产业端落地的模式主要有两种,一种是企业进行私有化部署,这种模式的安全性和隐私性较高,但企业需要非常高昂的算力成本;另一种是企业通过公有云+API调用的模式,成本更低,灵活性也更高。在金融、医疗等对安全性和合规性要求较高的领域,一些企业选择了私有化部署,但在更广泛的领域中,公有云+API调用模式成为企业使用大模型的主流方式。这种全新的需求也在改变云计算行业的竞争方向。

2024-07-09 10:42:29 765

原创 如何破解大模型应用有场景但落地难的问题?

许多大模型在场景中有很多潜在的应用,但在实际落地中常常会面临着各种各样的挑战和困难。具体而言,大模型通常需要大量的高质量数据进行训练,收集、整理和标注这些数据可能需要耗费大量的时间和资源,数据的质量和多样性对大模型的性能有很大影响。训练大模型需要强大的计算资源,包括计算能力和内存,这可能需要大量的资金投入和时间等待来建设和维护相应的基础设施。大模型通常具有复杂的结构和参数,这使得它们在部署和应用时具有一定的难度,模型的解释性、可扩展性和可维护性等问题也需要认真考虑。

2024-07-09 10:41:47 292

原创 大模型如何把企业的数据用起来

现在的你已经进入机器学习工程师这条“伟大的航路”了,也许修行之路才刚刚开始。技术发展日新月异,练好“内功”才能走的更远。

2024-07-09 10:41:17 727

原创 大模型如何把企业的数据用起来

现在的你已经进入机器学习工程师这条“伟大的航路”了,也许修行之路才刚刚开始。技术发展日新月异,练好“内功”才能走的更远。

2024-07-09 10:39:43 545

原创 系统总结:AI产品经理知识体系

这篇博客全面介绍了大型语言模型(LLMs)的构建流程,从流行架构的选择到实际建模的每个关键步骤。文章首先探讨了LLMs的模型架构,然后详细阐述了数据准备过程,包括数据的收集、清洗和去重,接着是关于如何进行有效标记化的讨论。在模型构建方面,博客详细解释了采用自监督学习方法的预训练过程,以及对模型进行指令微调和对齐的重要性。每个环节都被细致地讲解,使读者能够深入理解LLMs的构建和优化过程。这篇博客为那些对LLMs工作方式感兴趣的读者提供了一个指导。

2024-07-08 10:49:06 543

原创 一文详解大语言模型的流行架构与训练技术

这篇博客全面介绍了大型语言模型(LLMs)的构建流程,从流行架构的选择到实际建模的每个关键步骤。文章首先探讨了LLMs的模型架构,然后详细阐述了数据准备过程,包括数据的收集、清洗和去重,接着是关于如何进行有效标记化的讨论。在模型构建方面,博客详细解释了采用自监督学习方法的预训练过程,以及对模型进行指令微调和对齐的重要性。每个环节都被细致地讲解,使读者能够深入理解LLMs的构建和优化过程。这篇博客为那些对LLMs工作方式感兴趣的读者提供了一个指导。

2024-07-08 10:47:54 824

原创 系统总结:AI产品经理知识体系

小白AI之路”第一篇文章已经快到尾声了,如果你坚持看到了这里,那大概率你对AI的理解和认知已经击败了你朋友圈里90%经常分享AI将改变世界取代人类的好友们。接下来我们的目标是从剩下的10%里往上爬,我也希望能够通过更有趣、更直观、更少数学的方式跟大家分享和学习AI相关知识。当然我也还是一个AI世界的小学生,也还在努力地学习和奔跑。如果大家觉得还算有那么一丢丢的收获并且身边也有朋友在关注和学习AI的话,请随肆无忌惮随意分享哈!

2024-07-08 10:46:25 764

原创 知识图谱检索增强的GraphRAG(基于Neo4j代码实现)

对一个查询问题分别进行了测试, 与没有RAG,仅利用LLM生成回复的情况进行对比,在有GraphRAG 的情况下,LLM模型回答的信息量更大、准确会更高。

2024-07-08 10:45:18 1095

原创 干货!中国人工智能大模型技术白皮书

尽管大模型技术具有广泛的应用前景和潜力,但仍需要解决其**可靠性和可解释性问题,降低应用部署代价,提高迁移能力,并加强安全与隐私保护。**这些问题的解决将是大模型技术未来能否得到广泛应用和发展的关键。

2024-07-08 10:38:06 915

原创 一文梳理有效提升RAG效果的方法

RAG 是 “Retrieval-Augmented Generation”(检索增强生成)的缩写,它通过结合检索系统和生成模型来提高语言生成的准确性和相关性。RAG 的优势在于它能够在生成响应时引入外部知识,这使得生成的内容更加准确和信息丰富,对于处理需要专业知识或大量背景信息的问题尤其有效。随着大型语言模型(LLMs)的发展,RAG 技术也在不断进化,以适应更长的上下文和更复杂的查询。

2024-07-05 11:51:07 859

原创 计算机视觉与机器学习之文档解析与向量化技术加速多模态大模型训练与应用——文件向量化大模型!

在人工智能时代,多模态大模型的发展不仅仅是技术创新的产物,它更是对人类交互和信息处理方式的一种模拟。我们的世界是多模态的:我们不仅阅读文字,还观察图像,聆听声音,感受触觉。多模态大模型试图通过模拟这种丰富的信息处理方式来增强机器的理解能力。这些模型的核心优势在于它们的整合能力。传统的单模态系统在处理单一类型数据时可能表现出色,但它们无法捕捉跨模态的复杂关系。例如,一段视频内容不仅包含视觉元素,还可能包含重要的音频信息,甚至是文字信息(如字幕或场景中的文本)。

2024-07-05 11:50:23 786

原创 你想在本地部署大模型吗?本地部署大模型的三种工具

人工智能的发展如火如荼,也让越来越多的人了解到人工智能;而对大部分人来说使用的都是第三方提供的客户端,不论是网页版,还是PC端或移动端。那么,我们怎么在本地部署一款大模型呢?下面就来介绍三种工具。

2024-07-05 11:49:45 1148

原创 关于那些想要转行AI的人:送你一份人工智能入门指南以及学习路线资料

*人工智能是什么?人工智能为何重要?我们应该畏惧人工智能吗?**你可能会从网上知道人工智能如何为亚马逊和Google的虚拟助理提供支持,或者人工智能如何一步步地取代所有的工作(有争议的),但是这些文章极少很好的解释人工智能是什么(或者机器人是否将要接班)。本文将对人工智能做出解释,这份简明指南将随着领域的发展和重要的概念出现进行更新和改进。人工智能是具有学习机制的软件或计算机程序。人工智能使用这种知识在新的情况下做出决定,就像人类一样。

2024-07-05 11:49:05 818

原创 听说现在AI产品经理薪资30k起步?0基础可以转行AI产品吗?

AI产品经理是对AI技术应用和功能落地负责,并为公司带来商业价值的一群人,主要集中在。

2024-07-05 11:48:32 986

原创 AGI大模型的门槛是什么?怎么学

AGI大模型涉及众多前沿技术,包括深度学习、自然语言处理、计算机视觉、强化学习、认知科学等。这些技术本身就有很高的学习门槛,需要深入的理论知识和实践经验。:AGI大模型的训练需要大量的计算资源,如GPU、TPU等,这些硬件资源通常需要大量的资金投入。此外,模型训练过程中产生的数据也需要强大的存储和处理能力。:AGI大模型需要大量高质量的数据来训练,包括文本、图像、声音等多种类型的数据。这些数据的收集、清洗、标注等都需要大量的人力和时间投入。

2024-07-04 10:19:56 889

原创 那些自学【大模型】的,能骂醒一个算一个

为啥说胡乱自学大模型的,能骂醒一个算一个。因为很多人学会个AI工具就觉得自己会玩大模型了,其实你才刚入门!随着人工智能技术的飞速发展,大模型研究已成为该领域的一大热点。这些研究覆盖了众多方向,每个方向都面临着独特的研究焦点和挑战。本文将逐一探讨一些备受关注的研究方向,包括检索增强生成RAG、大模型Agent、Mamba、MoE、LoRA等,这些方向致力于解决大模型在实际应用中的关键问题,以提升其性能和实用性。检索增强生成RAG通过结合信息检索和文本生成,显著提升了AI系统的效能。

2024-07-04 10:18:40 867

原创 作为程序员的他,大学四年一直自学,全靠这些实用工具和学习网站!

鸡腿哥,你好,马上 6 月份就要毕业了。以上是读者小青给我发的信息,看完后觉得非常感动,尤其是他乐于分享的态度,值得我们所有程序员尊重。我认真看了看他发给我的实用工具和学习网站,的确是些好东西,所以我决定分享出来,其中也包含了一些我自己珍藏的。一下子全分享出来给各位学弟学妹们,因为年轻人不光有勇气,还有远大的前程。每个年轻人都应该抱着强烈的求知欲,也只有这样,你才不会停下前进的脚步。先来说实用工具。

2024-07-04 10:17:29 785

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除