自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(331)
  • 收藏
  • 关注

原创 让天下没有难学的大模型!超详细的一份大模型技术知识图谱!

大模型检索增强生成技术是增强通用大模型能力,也是降低幻觉的大模型微调技术、同样是构建企业私有大模型两大技术手段之一(RAG、微调),因此需要好好掌握,包含以下几个。大模型微调技术是增强通用大模型能力,降低幻觉的核心技术,也是构建企业私有大模型两大技术手段之一(RAG、微调),因此需要好好掌握,包含以下几个。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2024-09-26 22:35:09 1229

原创 如何成为AI产品经理

成为AI产品经理是一个充满挑战和机遇的职业道路。如果你对人工智能充满热情,并且愿意不断学习和适应新技术,那么这可能是一个适合你的职业选择。记住,成为一名优秀的AI产品经理,不仅需要技术知识,更需要创新思维和用户导向的产品设计能力。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2024-09-26 22:33:34 1091

原创 AI产品经理需要了解的算法知识

简而言之,NLP是让计算机理解自然语言,而NLG是让计算机生成自然语言。两者结合在一起,可以构建出更加智能和交互式的应用程序,如智能助手、自动写作系统和交互式对话系统。

2024-09-26 22:33:00 1625

原创 大模型学习练级的五个阶段,你到哪个阶段了?

其实一开始就找到了,需要用langchain来跑大模型,但是还需要用一个很坑很坑的东西:Anaconda,这玩意儿简直是个坑,这工具是为了给我们在windows上创建python环境,然后安装pytorch,下载几个G的大模型,然后安装依赖,搞了半天,搭起来了,但是对话的时候却报错了。第四阶段,看到大神已经在整合各种大模型,并能够熟练训练成更加贴合自己的模型,整合到实际的业务场景中,并且实现多个模型进行同时回答,并且还有专门的校验模型,如果发现几个模型的答案不一致,给出提示,后续进行人工校正。

2024-09-24 17:22:31 762

原创 大模型技术学习过程梳理

‍‍‍‍‍‍‍从大的方向上来说,大模型从技术到应用,主要涉及到以上几个大的模块;而每个模块又涉及到大量的技术和细节。比如打造不同任务的神经网络模型,强化学习,迁移学习,知识蒸馏,分布式训练与存储等;以及RAG使用的向量检索,向量数据库,语义理解等,还有复杂任务的思维链(CoT),模型训练使用的LoRa等微调方法。还有多模态模型中的知识对齐,数据融合等复杂技术。‍‍‍因此,大模型技术到应用到学习是一个系统性的复杂过程,中间涉及到无数的技术细节和理论,并且还在不断的产生新的技术和理论。千里之行,始于足下。

2024-09-24 17:20:34 711

原创 怎么快速入门大模型技术——人工智能技术学习方法

师父领进门,修行在个人有两个成语,一个是事半功倍,一个是事倍功半;为什么会有这种情况?‍‍‍‍‍‍‍原因就是方式方法的问题,有些人掌握了正确的方法就会觉得做什么事都顺风顺水,事半功倍;而有些人使用了错误的方法,做什么都有问题,就出现了事倍功半。学习更是如此,有些人掌握了学习的技巧,天天玩但成绩又特别好。大模型学习方式方法总结人工智能技术虽然不能说是一个完全新兴的领域,但也是在最近两年得到爆发式的发展,而且对大部分人来说,人工智能技术还属于一个新兴的领域。

2024-09-24 17:18:01 1176

原创 大模型学习方法之——大模型技术学习路线

经验总结:定期回顾学习过程,总结技术要点和实战经验跨学科融合:探索大模型在其它领域(如金融,法律,医疗等)等应用,扩展知识广度‍如果用一句话总结就是,学习——实践——再学习——再实践。‍‍‍‍‍‍‍。

2024-09-23 20:38:21 1095

原创 一文彻底搞懂大模型 - RAG(检索、增强、生成)

RAG(Retrieval-Augmented Generation,检索增强生成) 是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG模型由Facebook AI Research(FAIR)团队于2020年首次提出,并迅速成为大模型应用中的热门方案。一、检索增强生成(RAG)什么是RAG?RAG(Retrieval-Augment

2024-09-23 20:37:44 1635

原创 AI大模型技术学习过程梳理!

‍‍‍‍‍‍‍从大的方向上来说,大模型从技术到应用,主要涉及到以上几个大的模块;而每个模块又涉及到大量的技术和细节。比如打造不同任务的神经网络模型,强化学习,迁移学习,知识蒸馏,分布式训练与存储等;以及RAG使用的向量检索,向量数据库,语义理解等,还有复杂任务的思维链(CoT),模型训练使用的LoRa等微调方法。还有多模态模型中的知识对齐,数据融合等复杂技术。‍‍‍因此,大模型技术到应用到学习是一个系统性的复杂过程,中间涉及到无数的技术细节和理论,并且还在不断的产生新的技术和理论。

2024-09-23 20:35:03 691

原创 AI大模型入门指南

AI大模型是指拥有大量参数的机器学习模型,这些参数可以达到数十亿甚至数千亿。它们通过深度学习技术,能够处理和学习复杂的数据模式,执行语言理解、图像识别和自然语言处理等多种任务。在工作原理上,AI大模型基于深度神经网络架构,通过模拟人脑神经元的连接方式,从大量数据中学习规律。这些模型通过不断优化自身的参数,提高对各种输入的预测和响应的准确性。简而言之,AI大模型通过海量数据训练,不断学习并改进其性能,以达到或超越人类专家在特定任务上的表现。

2024-09-20 18:00:34 1065

原创 程序员如何实现自我成长?吃上大模型红利

Inflection AI 的 Pi 是目前使用体感最好,如果说我将 ChatGPT 当作工具人,那 Pi 就是一个善解人意的小伙伴,优先于人的设计理念,相比其他服务于生产力、搜索或解答问题的 AI,可以放心将 Pi 视作一个具有创造力的教练、朋友或者是一个“发泄情绪”的对象,当然有类似定位的还有致力于让每个人都可定制自己的个性化 AI 的 Character.ai,不过靠提示词调教出来的虚拟角色稳定性堪忧,但是以这个项目作为入口,收集海量高质量交互数据,具备构建出体验超过 Pi 的大模型潜力。

2024-09-20 17:56:47 1596

原创 分享!!!AI小白的大模型学习过程!

导读写这篇文章的初衷:作为一个AI小白,把我自己学习大模型的学习路径还原出来,包括理解的逻辑、看到的比较好的学习材料,通过一篇文章给串起来,对大模型建立起一个相对体系化的认知,才能够在扑面而来的大模型时代,看出点门道。为什么要写这篇文章?首先我关注到了两个变化。

2024-09-20 17:56:01 1319

原创 通过一个 AI 产品的落地,掌握产品经理工作全流程

对于任何一家互联网公司来说,用户流失都是我们必须要关注的一个问题。这篇文章,我就通过我一个预测用户流失的项目,带你了解一个 AI 产品从筹备到上线的全流程。从中,你可以体会到 AI 产品经理的完整工作流程是什么,每一个环节都有什么角色参与,每个角色需要做什么工作,他们的产出又都是什么。业务背景。

2024-09-17 09:00:00 1022

原创 AI大模型工业应用模式及其实现

人工智能是引领这一轮科技革命和产业变革的战略性技术,具有“头雁”效应,溢出带动性很强。通用人工智能大模型(以下简称“大模型”)作为人工智能从专用化迈向通用化的发展新阶段,是集智能感知、智能分析、智能决策、智能执行等功能于一体的泛在智能技术,通过数据、算力、算法三要素深度融合,实现生产要素优化配置。从生产结构来看,人工智能技术已成为现代工业生产的核心组成部分,能够大幅提高生产效率、优化资源配置、降低生产成本,为新型工业化发展提供强大的技术支持和动力。

2024-09-17 08:00:00 738

原创 大模型算法岗常见面试题100道

LangChain是一个用于构建和运行大型语言模型应用的开源框架。它提供了一套工具和组件,帮助开发者将大型语言模型(如 GPT-3)与其他工具和API结合,以完成更复杂的任务。1、LangChain包含哪些核心概念?Components:可重用的模块,例如API调用、数据库查询等。Chains:将多个Components链接在一起以完成特定任务的流程。Prompt Templates: 用于指导语言模型生成输出的文本模板。Output Parsers:解析语言模型输出的工具。

2024-09-17 07:00:00 653

原创 AI产品经理的入门路线图

AI技术的核心是模仿人类的学习和决策过程,以在特定任务上达到并超越人类的表现。机器学习是实现AI的一种手段,它使计算机能够通过数据学习和改进。在机器学习中,算法通过对大量数据的分析学习,捕捉数据的模式和规律,并用于预测或分类任务。深度学习是机器学习的一个分支,它以人工神经网络为基础,尤其善于处理视觉和语言识别问题。深度学习模型通常需要海量的数据来训练,它可以识别和利用这些数据中的复杂模式。AI产品经理需要理解这些原理,才能准确地与团队成员和利益相关方沟通,并作出明智的决策。

2024-09-16 09:00:00 892

原创 基于大模型技术客服场景应用实践

✦大模型技术在银行业的应用前景广阔,从知识库问答到智能客服,大模型技术的运用让知识获取更简单、客户服务更高效。通过定制训练和微调,大模型可以满足特定场景下的需求,提高业务效率和用户体验。在光大银行的实践中,大模型技术已经取得了初步成效,随着大模型技术的不断发展和优化,相信在未来会有更多应用场景受益。

2024-09-16 08:00:00 865

原创 内行人都在学的大模型黑书 外网爆火的LLM应用手册来了!

Transformer 是工业化、同质化的后深度学习模型,其设计目标是能够在高性能计算机(超级计算机)上以并行方式进行计算。通过同质化,一个Transformer 模型可以执行各种任务,而不需要微调。Transformer 使用数十亿参数在数十亿条原始未标注数据上进行自监督学习。这些后深度学习架构称为基础模型。基础模型Transformer 是始于 2015年的第四次工业革命的一部分(通过机器-机器自动化将万物互联)。

2024-09-16 07:00:00 822

原创 AI大模型:引领软件开发行业的新浪潮

AI大模型是指具有海量参数、能够处理海量数据、具备强大泛化能力的深度学习模型。这些模型通过大量的数据和计算资源进行训练,能够学习到数据中的深层次规律和特征,从而实现更为准确和智能的预测、分类、生成等功能。AI大模型的出现,极大地推动了自然语言处理、计算机视觉等领域的进步,为软件开发行业带来了前所未有的机遇和挑战。

2024-09-15 09:00:00 659

原创 AI大模型开发,抓住属于程序员的时代红利!

现在AI看似很热,但好像大多人都是在讨论分享,而实际真正使用和应用的并不多。摩根士丹利最近做了一个2000多人的调研,结果竟然是有80%的人没有用过ChatGPT或是谷歌的Bard。由于大量的专业词汇,都显得过于高大上了,一下拉远了普通人与AI的距离。以至于大量教人使用AI的人赚的盆满钵满。。。OpenAI正沿着类苹果模式的“终端+平台+生态”,迈向高于操作系统的战略地位。

2024-09-15 08:00:00 724

原创 大模型时代,程序员当下如何应对 AI 的挑战

随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色正在经历深刻的变革,我们不得不重新对自己进行审视和思考。在过去的二十年内,AI 领域的大部分研究和应用都集中在完成一项特定的任务中,例如:分类图片、总结文章、多语言翻译等,然而随着模型参数的增加, ChatGPT 的出现体现了“大模型”在通用领域内令人惊叹的能力,一些不存在于模型内的泛化能力突然出现了,AI 突然从大型的复读机变成了真正的人工智能。

2024-09-15 07:00:00 923

原创 普通程序员如何转型人工智能?

1、职业前景广阔:人工智能领域正在快速发展,相关职位需求持续增加,转型后可以获得更多的就业机会和职业发展空间。2、高薪资水平:人工智能专业人才通常享有较高的薪资待遇,相比于传统程序员,AI工程师的薪资普遍更具竞争力。3. 技术前沿:人工智能是当前科技发展的前沿领域,参与其中可以接触到最新的技术和研究,提升个人的技术水平和竞争力。4、解决实际问题:人工智能技术能够应用于各个行业,帮助解决实际问题,转型后可以参与更具挑战性和影响力的学术和工业界项目。

2024-09-14 15:01:02 771

原创 25岁的Java工程师,6个月顺利转行人工智能

曾经我是一名Java开发者,在过去的日子里,经历了夜以继日的加班、浑浑噩噩的摆烂。如今,作为一名从博学谷毕业的人工智能从业者,职业生涯再度焕发活力,生活也变得非常愉快。接下来,我将转变前后的这段经历分享给大家。很早之前,我在一家小公司担任Java开发人员,每天忙于增删改查。虽然收入不高,但公司氛围不错,福利也还可以,我原以为这样的生活会一直延续下去。然而,2022年底,当时我拿着经过模型调整后的代码,进行code review(代码审查)时,竟获得了一致好评。

2024-09-14 14:57:44 1141

原创 我,28岁,应不应该从从普通工程师转行到AI?

28岁的物理工程师,想转行做AI到底值不值?机器学习工程师在企业中的现状又是什么样子的?一则求助帖,在今日的Reddit论坛上迅速发酵:我是一名物理工程师,对目前的工作不那么感兴趣,甚至有点想回学校稍微逃避下现实和责任。在没毕业前,有人建议我去搞机器学习,也激励我去做计算机视觉方面的实习,去做更多的项目等。目前我已经有一份工作了,我想“重新考虑”这条路。目前的工作能看到数据处理的重要性和繁琐性。基于上述原因,我原来越倾向参加一个AI方面的一年制专业硕士课程。但是,我想知道?

2024-09-14 14:53:02 1220

原创 一文彻底理解大模型 Agent 智能体原理和案例

大模型 Agent,作为一种人工智能体,是具备环境感知能力、自主理解、决策制定及执行行动能力的智能实体。简而言之,它是构建于大模型之上的计算机程序,能够模拟独立思考过程,灵活调用各类工具,逐步达成预设目标的智能存在。Agent 是 AI 大模型应用的主要新形态,在技术架构范式也发生了很大的变化,从面向过程的架构变成了面向目标架构。

2024-09-13 21:05:31 1079

原创 大模型在金融领域的应用与思考

中国工程院院士、复旦大学金融科技研究院院长、教授,博士生导师。

2024-09-13 21:04:31 882

原创 大语言模型在新闻采访中的应用与价值

随着人工智能技术的快速发展,大语言模型在新闻采访中的应用日益广泛。本文主要探讨了大语言模型如何帮助记者提升提问能力,通过具体案例分析了大模型在新闻采访中的应用价值。本文旨在为新闻从业者提供一种新的视角和方法,以提升新闻报道的质量和效率,同时还提出了记者在使用大模型时要注意做好事实核查、尊重知识产权等方面的问题,提醒不要被大模型误导。

2024-09-13 21:03:42 859

原创 大语言模型高效推理技术

24年6月来自无问芯穹、清华大学和上海交大的论文“A Survey on Efficient Inference for Large Language Models”。大语言模型 (LLM) 因其在各种任务中的出色表现而受到广泛关注。然而,LLM 推理对计算和内存的大量要求对在资源受限的情况下的部署带来了挑战。如何提高 LLM 推理效率?本文对现有的高效 LLM 推理进行了全面调查。首先分析 LLM 推理效率低下的主要原因,即模型规模大、二次复杂度的注意操作和自回归解码方法。

2024-09-09 11:54:17 1190

原创 一文梳理LLM中的核心概念

牛顿运动定律并不是“先知”告诉牛顿的,而是牛顿本人经过观察、测量、记录、思考、假设、验证等一系列步骤后总结出来的。这个总结的过程就是建立模型的过程,最后得到的结论就是一个模型。有些模型是有名字的,比如“牛顿第一、第二、第三运动定律”。根据建立的模型,我们可以直接计算出给定条件(输入)下我们关心的问题的结果是什么(输出),这也就是用模型进行“预测”的过程,这一过程有时候也叫做“推理”。为人类语言文本建立的模型就是语言模型。大语言模型的“大”体现在模型的参数量很多,比如ChatGPT有1750亿个参数。

2024-09-09 11:53:43 980

原创 终于能把火爆全球的大语言模型LLM学懂了!

这些模型通常由深度神经网络构建而成,这些模型在不同的上下文中可能有不同的大小阈值。例如,对于自然语言处理(NLP)领域,大模型可能指的是包含数十亿到千亿参数的模型,如GPT-3、GPT-4等。对于计算机视觉领域,大模型可能是拥有数亿参数的深度卷积神经网络,如ResNet-152。做为 LLM 的基础模型,这个模型是入门绝对绕不开的。这本书的代码都是进行了注释的,不仅可以让大家快速理解这些代码,还能知道实现的目的以及如何实现的。

2024-09-09 11:53:02 863

原创 使用大模型提效程序员工作

通过在接手其他语言的项目中使用大模型、生成脚本辅助日志查询、根据接口文档使用大模型直接生成Java Bean代码以及学习新技术这四个场景的实践,我们可以更快地理解代码、更快地查找线上问题,以及减少编码时间。比如:你可以输入一段 Lua 脚本,询问大模型,这段脚本的意思,还可以让它详细解释每行代码的意思,让我们更快接手一个我们不熟悉编程语言写的项目。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。但使用大模型仍然能够大大提升我们学习新技术的效率。

2024-09-09 11:51:34 1136

原创 终于能把火爆全球的大语言模型LLM学懂了!

这些模型通常由深度神经网络构建而成,这些模型在不同的上下文中可能有不同的大小阈值。例如,对于自然语言处理(NLP)领域,大模型可能指的是包含数十亿到千亿参数的模型,如GPT-3、GPT-4等。对于计算机视觉领域,大模型可能是拥有数亿参数的深度卷积神经网络,如ResNet-152。做为 LLM 的基础模型,这个模型是入门绝对绕不开的。这本书的代码都是进行了注释的,不仅可以让大家快速理解这些代码,还能知道实现的目的以及如何实现的。

2024-09-05 16:04:44 1187

原创 使用大模型提效程序员工作

通过在接手其他语言的项目中使用大模型、生成脚本辅助日志查询、根据接口文档使用大模型直接生成Java Bean代码以及学习新技术这四个场景的实践,我们可以更快地理解代码、更快地查找线上问题,以及减少编码时间。比如:你可以输入一段 Lua 脚本,询问大模型,这段脚本的意思,还可以让它详细解释每行代码的意思,让我们更快接手一个我们不熟悉编程语言写的项目。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。但使用大模型仍然能够大大提升我们学习新技术的效率。

2024-09-05 16:04:07 539

原创 2024国内主流AI 大模型架构及应用场景深度分析

◼ 产业级知识增强大模型,夫嫩行业大模型发展百度文心大模型源于产业、服务于产业,是产业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展,打造了自主创新的 AI 底座,大幅降低了 AI 开发和应用门槛。文心大模型一大特色是“知识增强”,百度自研的多源异构知识图谱拥有超过 5,500 亿条知识,被融入到文心大模型的预训练中。文心大模型凭借海量数据和大规模知识的融合学习,能实现更高的效率、更好的效果、更强的可解释性。◼ 大模型架构分三层体系。

2024-09-05 16:03:28 1411

原创 部署大型语言模型推理的基础知识

运行大型语言模型(LLM)是一项复杂而富有挑战性的任务。主要挑战在于模型规模巨大,对计算资源和存储空间提出了极高的要求。为了解决这一问题,模型分片技术至关重要,它可以将模型分割到多个服务器上,有效分散计算负载。此外,精心设计和优化模型服务和推理流程对于处理高并发请求和数据至关重要。构建和维护支持所有这些的基础设施还需要深厚的技术知识,涵盖分布式计算、数据管理和机器学习等多个领域。基础设施建设本身就是一个复杂的过程,需要在硬件和软件层面进行大量投资。大型语言模型的成本考量。

2024-09-05 16:02:48 413

原创 了解一点智能体(Agent)

百度百科对智能体的定义:智能体,顾名思义,就是具有智能的实体,英文名是Agent。以云为基础,以AI为核心,构建一个立体感知、全域协同、精准判断、持续进化、开放的智能系统。

2024-09-05 16:02:09 583

原创 AI 智能体应该怎么学?就业前景如何?

2023 年 ChatGPT 的问世,给 IT 科技届带来了不小的轰动。而。

2024-09-05 16:01:29 1225

原创 李彦宏谈AI应用新视角:智能体引领未来潮流

在在AI技术飞速发展的今天,百度创始人李彦宏以其前瞻性的视野,为我们揭示了AI应用的新方向——“智能体”。这一概念不仅挑战了传统“超级应用”的思维模式,更为未来AI生态的构建提供了无限可能。

2024-09-05 16:00:50 732

原创 吴恩达揭秘:编程Agent如何革新软件开发行业

作为 AI 领域的杰出人物,教授对编程 Agent 的兴起表示了极大的兴趣。他认为,编程 Agent 有潜力通过自动执行繁琐的任务、提高代码质量和加速开发周期来彻底改变软件开发行业。本文将深入探讨吴恩达对编程 Agent 的见解,等关键概念。通过实际案例和深入分析,我们将探索这些技术如何协同工作,使编程 Agent 能够以更高的效率和有效性构建软件。

2024-09-02 22:11:20 782

原创 大模型时代,新手和程序员如何转型入局AI行业?

在当今大模型迅猛发展的环境下,人工智能的应用越来越广泛。然而,这些大模型的背后隐藏着更为深厚的基础技术——传统机器学习和神经网络。理解这些基础技术,不仅能够帮助我更好地使用大模型,还能为我提供创新和解决实际问题的能力。因此,在这个AI迅猛发展的时代,掌握传统机器学习和神经网络显得尤为重要。在近期的全国两会上,“人工智能”再次被提及,并成为国家战略的焦点。这一举措预示着在接下来的十年到十五年里,人工智能将获得巨大的发展红利。

2024-09-02 22:10:47 948

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除