- 博客(732)
- 收藏
- 关注
原创 哦豁!有了这份学习路径,AI小白也能学懂大模型!
元仔有求必应,为各位同学整理出一份完整的大模型学习路径规划!首先,AI小白应从基础出发,理解什么是大模型。大模型,顾名思义,是指,如GPT系列、BERT等。这些模型通过在海量数据上进行预训练,学会了丰富的知识表示和泛化能力,能够应用于等多个领域。了解大模型的发展历史、当前趋势以及未来展望,有助于构建全局视野。接下来,是必不可少的。这包括等。通过学习这些理论知识,你将能够理解大模型是如何通过复杂的计算框架实现高效学习与推理的。理论学习之后,实践是检验真理的唯一标准。,并逐步向更复杂的结构迈进。
2024-11-23 11:39:24
414
原创 RAG与微调:大模型落地的最佳路径选择
一、大模型技术发展现状自2022年底ChatGPT掀起AI革命以来,大语言模型(LLM)技术快速迭代发展,从GPT-4到Claude 2,从文心一言到通义千问,大模型技术以惊人的速度发展。然而,在企业实际应用场景中,在企业探索大模型技术落地的过程中,**RAG(检索增强生成)微调(Fine-tuning)**成为了两大主要技术方案。到底应该如何有成本和预算可控的情况下,又能基于当前的技术成熟度和应用边界来选择和确定一套可行的大模型技术验证方案,成为技术决策者面临的重要课题。二、企业落地大模型主要挑战。
2024-11-23 11:38:25
572
原创 AI入门必看的超详细人工智能学习路径
人工智能包括机器学习和深度学习深度学习,而自然语言处理和计算机视觉正是人工智能领域热门的方向。**路径一:**如果你希望快速学习完进行项目实践,请直接学习深度学习,不过编程和数学基础还是要有的(之后如果遇到不懂的地方,单独学不懂的地方就可以了)**路径二:**一步一个脚印,扎扎实实从基础学起,逐步提高学习难度(后附学习大纲)在深入学习人工智能之前,你需要对这个行业有一个初步的了解,包括当前的发展趋势和关键技术。这样,你就能为接下来的学习做好准备。机器学习领域包含了众多算法,这些算法往往基于数学理论。
2024-11-23 11:35:10
700
原创 一个关于学习大模型技术的方法论
知行合一,在行中知,在知中行最近在公众号分享关于一些学习大模型技术的基础路线和进阶方式,然后后台就收到了一些留言,总体来说就是大模型学习难不难,需不需要一些基础等。而今天我们就来讨论一下关于大模型技术学校的方法论,或者说关于学习的方法论。关于学习大模型技术的方法论其实说是学习大模型技术的方法论,不如说是怎么学习的,也就是关于学习的方法,毕竟大模型也只是学习的一个方向而已。先来回答读者比较感兴趣的问题,那就是学习大模型需要有基础吗?比如说机器学习,深度学习,编程,算法等等。
2024-11-23 11:33:51
593
原创 终于!有人总结了大模型学习资料!
大家好,鸡腿我发现了一个大模型学习的神库,包含大量LLM教材和资料,并绘制了学习路线图。可以帮助快速掌握大模型的应用和开发技巧。
2024-11-23 11:28:17
335
原创 一文尽览!大模型微调方法汇总
大模型由于计算量过于庞大,所以无论是学术界还是工业界,都很难支撑起来从头训练的成本,所以业界开始研究各种大模型微调方法,下面就给大家汇总下领域常用的微调方法。
2024-11-22 11:13:00
834
原创 震撼!学会大模型AI原来这么简单!从0上手保姆级教程
最近ChatGPT太火了,是不是也想学习AI大模型技术?但是一堆专业术语就头大了?别担心,今天我要分享一个超简单的学习路线,保证小白也能看懂了!首先,你需要掌握三个基础数学知识: 1️⃣ 线性代数 - 线性代数就是教计算机理解和处理大量数字的方法。2️⃣ 微积分 - 帮助理解AI是如何一步步学习的 3️⃣ 概率统计 - 让AI能够做出更准确的判断 不要被吓到了!这些超好懂的网课,现在有超多免费课程,就像看抖音一样简单!就像我的课,讲得特别简单,连那些数学学渣都听懂!
2024-11-22 11:12:00
359
原创 全面深入了解大模型(LLM)
AIGC指内容生成式人工智能,指的是一种AI的类型,包括图像,文本,音频等内容生成式AI。所以这里包括了目前比较火热的AI绘画以及基于大语言模型的AI对话。2. 大模型到底指什么?其实我们目前讨论最多的大模型主要是指大语言模型(LLM),但是大模型并不单单指LLM,首先我们要理解大模型的概念,我们首先对这个词拆分来看,大是什么意思?模型又指代什么?首先我们来理解下模型,所谓模型通俗的讲是一个基于神经网络构建好的一个处理器,它能够根据输入产生相应的预测或者输出内容。
2024-11-22 11:09:19
1033
原创 迎接大模型时代:初识大模型
大模型是指具有数千万甚至数亿参数的深度学习模型。大模型的原理是基于深度学习,它利用大量的数据和计算资源来训练具有大量参数的神经网络模型。通过不断地调整模型参数,使得模型能够在各种任务中取得最佳表现。通常说的大模型的“大”的特点体现在:参数数量庞大、训练数据量大、计算资源需求高等。很多先进的模型由于拥有很“大”的特点,使得模型参数越来越多,泛化性能越来越好,在各种专门的领域输出结果也越来越准确。
2024-11-22 11:06:50
696
原创 从零构建大模型训练流程及原理(一)
大型语言模型(LLMs)是基于Transformer架构的深度学习模型,旨在理解、生成和响应类似人类文本的神经网络,具备数十亿参数,专门用于处理和生成自然语言文本。这些模型通过海量数据训练,利用其复杂的网络结构来捕捉语言的序列依赖性和上下文关系。LLMs的核心优势在于其无需手动特征工程,能够自动从数据中学习表示,从而在多种自然语言处理任务中展现出强大的性能和适应性。图1.1 如此层次化的不同领域关系图表明,LLM(大语言模型)代表了深度学习技术的一种具体应用,利用其处理和生成类人文本的能力。
2024-11-21 11:28:24
724
原创 大模型是如何训练的?
大模型(Large Models)的训练是近年来人工智能领域的核心技术之一,尤其是在自然语言处理、计算机视觉等任务中,如 GPT、BERT 等模型的成功背后,离不开复杂的训练过程。本文将为你介绍大模型是如何训练的,包括数据准备、模型架构、训练方法和硬件支持等方面。大模型的训练需要大量的数据,因为它们需要从海量信息中学习模式和规律。
2024-11-21 11:27:30
422
原创 从零基础到精通大语言模型(1)N-gram
N-gram 是一组由 N 个连续单词组成的片段。例如,在句子 “I love natural language processing” 中,2-gram 是 (“I love”, “love natural”, “natural language”, “language processing”)。
2024-11-21 11:16:15
704
原创 如何零基础入门扩散模型?
扩散模型(Diffusion Models)是一种近年来备受关注的生成模型,它通过逐步反向模拟噪声的扩散过程,生成高质量的图像、文本甚至音频。相比于传统生成对抗网络(GAN),扩散模型在生成质量和稳定性上表现出色,且逐渐成为诸多AI生成任务中的首选。
2024-11-21 11:13:25
903
原创 如何从头训练大语言模型,实战经验分享!!
自8月底训好自己的1.5B的LLM后,一直都没有发布一个完整的技术报告,不少小伙伴私信我催更,千呼万唤始出来。豁然开朗:搞定全流程之后,对LLM确实豁然开朗不少,不过,发现要学的新东西更多了…尤其是这三个月,qwen, meta, anthropic等等发布的好文章实在太多了,真不想落下,没时间"反刍"当年的剩饭。Reasoning兴趣:对reasoning更感兴趣了(其实训1.5B模型的初衷,就是为了给将来从pretrain开始做reason的增强打基础)。保研季忙碌。
2024-11-21 11:09:55
1013
原创 纯小白必看!这儿有一份大模型应用入门指南
今年 6 月,我回洛阳看望导师,相谈甚欢。期间,谈到我正在做的工作内容时,我无意间提到了 AI 大模型,这引发了老师们的兴趣。但因交谈时间有限,所以我仅用三言两语做了个简单介绍,并主动向他们承诺,回家后整理出一些目前比较好用的应用,推荐给他们试用。而这,是我写这份大模型介绍报告的初衷。离开洛阳不久,大概在7月初,我便完成了这份报告。它的内容很基础、也很简单,就是对大模型是什么,及其相关应用使用方法的基本介绍,只适合入门者阅读。起初,我没想过要公开发布它。
2024-11-20 11:14:02
973
原创 一文搞定AI大模型学习资源,从入门到精通
好久不见,甚是想念。近期了解学习了一些免费的AI大模型的课程资源,包括从入门到精通,适合不同学习阶段的需求,分享给大家。* 部分课程在科学上网模式下网页响应速度会更快些。包含 18 个独立课程,覆盖了从基础概念到实际编码示例的方方面面。课程支持 Python 和 TypeScript 编程语言,提供灵活的学习路径,学习者可以根据个人兴趣和需求选择课程。课程内容包括:生成式 AI 和大型语言模型基础;提示工程、聊天应用、搜索应用;图像生成应用、低代码 AI 应用;外部应用集成、用户体验设计、安全性;
2024-11-20 11:11:27
982
原创 个人从零开始打造大语言模型?攻略都在这里了!
首先,给出一个学习清单:构建大语言模型(LLM)所需知识与资源清单1.基础知识与技能编程语言:Python深度学习库:TensorFlow, PyTorch算法知识:自然语言处理(NLP),机器学习,深度学习2.推荐书籍《深度学习》 by Ian Goodfellow, Yoshua Bengio, and Aaron Courville《自然语言处理综论》 by Christopher Manning, Hinrich Schütze3.开发工具。
2024-11-20 11:10:38
917
原创 大模型全套零基础教程
这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。
2024-11-20 11:06:48
382
原创 普通人如何零基础进入AIGC大模型人形机器人赛道,自学攻略,应用转化项目案例
要进入人形机器人赛道,普通人需要了解和掌握一系列的技能和知识,包括机器人设计、编程、电子工程、机械工程以及团队合作和项目管理。以下是一个详细的指南,帮助你从零基础开始,逐步进入这个充满挑战和机遇的领域。基础教育和技能培养进入人形机器人领域,基础教育和技能培养是至关重要的第一步。这个阶段主要涉及学习基础科学知识和掌握专业技能,为之后的深入学习和实践打下坚实的基础。数学和物理是理解和设计机器人的基石。数学提供了一种语言和工具,用于描述物理世界中的关系和模式,而物理则为我们揭示了这些模式背后的基本法则。
2024-11-20 11:05:05
933
原创 聊聊普通工程师如何入坑大模型 | 附超详细教程!
前几天,跟强哥一起吃饭。他说,大模型的技术,真是太好玩了!他买了一台超高配置的游戏本,本来是想买回来打游戏放松放松的。结果后来发现,玩大模型的技术,比打游戏好玩太多了!我连连表示赞同,不错不错,关键是游戏本没白买啊,跑大模型正好也用得上😀(强哥是谁?不重要,你只需要知道是一位登上人生巅峰的技术大佬就好了)认真地说,以大语言模型 (LLM) 为核心的AI技术,正在如火如荼地席卷整个行业。技术的发展日新月异,几乎每天都有突破性的进展。现在这种状态,让我们俨然回到了十年之前移动互联网刚刚兴起的那个年代。
2024-11-20 11:02:39
581
原创 对国内外开源大模型(LLM)较为全面的整理
CodeFuse-13B 是基于 GPT-NeoX 框架训练的 13B 参数代码生成模型,能够处理 4096 个字符的代码序列。该模型在 1000B Token 的代码、中文、英文数据数据集上进行预训练,覆盖超过 40 种编程语言。为了进一步提升生成代码的效果和质量,该模型还在CodeFuse-Evol-instruction-66k 数据集上进行了微调,使得该模型能够生成更加准确、高效、符合要求的代码。
2024-11-19 10:58:32
795
原创 大模型有什么用?中国最懂模型的人是这么看的
月之暗面CEO杨植麟认为,大模型本质上是数据的压缩,但这个压缩可以产生智能,随着不断规模化模型,做更好的压缩,它能产生越来越多的智能。AGI现在并不一定需要精确的、量化的定义,它可能是一个定性的、感性的东西,它最重要的作用是能让所有人对接下来要发生什么事情有一个准备。百川智能CEO王小川。百川智能CEO王小川认为,现在到了AGI时代,有足够的科学家与资源参与进来,人类能够走向AGI。但是以现在的Scaling Law来看,这个事情还做不到AGI。AGI的定义在全球很难有一个完整的共识。
2024-11-19 10:56:59
1269
原创 【最全整理】大模型基本技术
最近平时工作可以说是把脑子想“干”了,所以花大概三个周末完成了这篇接近2w字的文章。写完感觉有很多不足,但还是随便找个时间发了吧。其一是,本来是打算从Llama 3这种优质开源模型和报告出发,进行一些知识上的梳理,结果行文时几乎保留了论文原来的结构,导致前一个知识点到下一个知识点不够丝滑;其二是,由于水平不够和“综合性”考量的限制,所以对很多需要深入的知识没有详尽。后面几个周末也许还会持续迭代一下本文,主要是继续细化技术点。所以也恳请诸位指出错误或不足,尽情提出需要补充内容的部分。
2024-11-19 10:54:26
695
原创 从大模型定义、大模型工作原理、大模型应用领域、大模型优缺点等详细简述大模型
大模型,作为深度学习领域的重要突破,具有一系列显著的特点,这些特点不仅定义了它们的独特性质,也决定了它们在各种应用场景中的表现。
2024-11-19 10:52:51
810
原创 大模型微调训练:从理论到实践
好了,我们已经深入讨论了大模型微调训练的方方面面,从理论计算量到实际训练时间的估算,从内存需求到数据量的选择。记住,在实际项目中,这些因素都需要综合考虑。比如,当你知道了数据量和目标模型的参数量,你就可以估算出:所需的理论计算量训练所需的最小内存在给定硬件条件下的预计训练时间所需的存储空间有了这些信息,你就可以更好地规划资源,也能更专业地向项目负责人或老板解释为什么需要这些资源。记住,大模型训练是一个复杂的过程,需要不断实践和调整。
2024-11-18 11:08:17
349
原创 手把手带你零基础快速入门大模型微调
微调大模型通常需要非常高的电脑配置,比如GPU环境,相当于你在已经预训练好的基础上再对大模型进行一次小的训练,但是咱们很多伙伴的电脑配置可能有些困难,不过不用担心,本次咱们使用阿里魔塔社区提供的集成环境来进行,无需使用你自己的电脑配置环境,只需要一个浏览器即可。本次微调的大模型是零一万物的Yi开源大语言模型,当然微调其他大模型的过程和原理也有差不多。这里说明一下,阿里魔塔社区对于新用户提供了几十小时的免费GPU资源进行使用,正好学习一下大模型的微调。话不多说,直接开始。
2024-11-18 11:07:22
847
原创 基于大模型的应用的价值到底在哪里?
在人工智能的浪潮中,大模型技术以其强大的学习能力和推理能力,正在逐渐改变我们的工作和生活方式。那么,大模型究竟是什么?它能做什么?不能做什么?其应用的边界在哪里?背后的原理又是什么?它的商业化如何?基于大模型的智能体是什么?它的商业化情况如何?01基于大模型的智能体是什么?基于大模型研发的智能体(Agent)通常是指利用大型语言模型(如GPT、BERT等)作为核心组件,构建的能够执行特定任务、与环境交互并做出决策的人工智能系统。
2024-11-18 11:02:36
977
原创 现在不学大模型,小心刚毕业的大学生带着大模型把你卷失业
要理解大模型,我们先来看看什么是语言模型。简单来说,语言模型就是一种根据语言客观事实而进行的语言抽象数学建模,是一种对应关系。它的核心任务是根据已出现的文本预测下一个词出现的概率。想象一下,当你在手机或电脑上输入文字时,输入法会自动给出一些候选词,这背后其实就是语言模型在起作用。比如,当你输入“今天天气很”,语言模型会根据大量的文本数据学习到的知识,预测下一个词可能是“好”“晴朗”“糟糕”等,每个词出现的概率会有所不同。当我们持续运用这种预测方式往后推进,就能得到一句话、一个段落甚至是一整篇文章。
2024-11-18 10:59:40
375
原创 如何最简单、通俗地理解大模型?
理解大模型(Large Model)本质上就是理解两个关键词:大、模型。首先我们理解什么是模型(Model)。模型是事物的抽象,可用于描述、解释和预测事物。例如数学公式、物理装置、计算机程序、人体模型都可以称为模型。在人工智能领域,模型特指学习算法从数据中提取的模式或规则,进一步用于数据的预测。这样理解可能会比较抽象,举个简单的例子:我们想让人工智能来识别图像里有没有猫,该怎么做呢?第一步,我们要准备数据。我们将大量有猫的图片和没有猫的图片做好标记,例如有猫标记为1,没有猫标记为0。
2024-11-18 10:57:52
1098
原创 零成本快速入门大模型指南
今年招聘市场确实是好点了,我发现群友都在讨论,得赶快学点 AI 大模型。他们有的是想正式转到一些新兴的 AI 行业,需要系统的学习训练。更多的是想跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。这也可以理解,ChatGPT 推出仅一年半的时间,就将生成式 AI 推向主流。从谷歌到亚马逊,从百度到阿里,几乎所有科技巨头都在布局 AI,也直接影响到了招聘市场,大模型相关的岗位数量多了不少,年薪甚至达到 80W-90W。
2024-11-15 13:45:41
262
原创 大模型人工智能课程学习资料:全套资料,助你高效学习
嘿,你有没有想过,未来的你会是一名AI领域的高手?如果你的答案是“肯定”,那你来对地方了!今天,我们就来聊一聊那些能够助你高效学习的大模型人工智能课程学习资料。放松点儿,带上一杯咖啡,咱们开始这次有趣的旅程。
2024-11-15 13:44:32
717
原创 现身说法,AI小白的大模型学习路径
阿里妹导读写这篇文章的初衷:作为一个AI小白,把我自己学习大模型的学习路径还原出来,包括理解的逻辑、看到的比较好的学习材料,通过一篇文章给串起来,对大模型建立起一个相对体系化的认知,才能够在扑面而来的大模型时代,看出点门道。为什么要写这篇文章?首先我关注到了两个变化。
2024-11-15 11:48:38
730
原创 AI应用落地:大模型如何驱动垂直行业深度融合?
随着技术革新和人工智能AI的快速发展,生产力模式正在发生深刻变革。大模型技术的应用不仅加速了传统产业的智能化转型,还推动了新兴产业的布局。2023年下半年以来,多个政府会议强调了数字经济发展与新质生产力相结合的战略方向。在此背景下,AI与大模型的行业应用成为了推动生产力提升的关键。根据艾瑞的测算,2023年中国AI产业规模约为2100亿元人民币,预计到2028年将达到,复合年增长率为。短期内,API调用的增加和大模型产品的广泛应用将推动市场扩张,尤其在计算机视觉和语言处理领域。图表:AI 产业规模预测。
2024-11-15 11:45:48
940
原创 为什么说LLM大模型是未来AI领域的核心?学它值不值?
这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。为代表的"软件智能体"(或称 “离身智能体”),使用大模型通过网负端、手机 APP 与用户进行交互,能够接受语音、文字、图片、视频的多种模态的用户指令,从而实现感知环境,规划、记忆以及工具调用,执行复杂的任务。作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。:百川智能2023年8月31日开放使用。
2024-11-15 11:37:57
693
原创 怎么设计一个自己的大模型?设计一个大模型需要哪些能力?
虽然深度学习的感念抽象的,并且数学的原理学习起来非常的复杂,但是已经有现成的库、方法和框架,将这些概念汇总和抽象出来,我们只要会一些Python的开发就可以直接拿来使用。如果你想深入的学习,也可以从最顶层最抽象的部分开始,然后往下一步一步进行学习,这样就不会因为底层的概念太过复杂而放弃。当然最后所有的基础是你需要有一块能够工作的GPU。
2024-11-14 11:27:56
791
原创 怎么设计一个自己的大模型?设计一个大模型需要哪些能力?
自己设计并实现一个大模型,才能对大模型技术有更加深刻的体会**”**对学习大模型技术的人来说,大家都想体验自己训练和微调一个模型,但受限于自身条件,可能很多人无法达成这个目的;但不知道有人是否思考过,能否自己设计一个模型,根据自己的想法去落地一个大模型。当然,这个大模型也不一定非要体积特别大,也可以是一个参数规模较小的模型。那么应该怎么实现它呢?设计一个大模型的思路怎么设计一个大模型,不知道大家有没有思考过这个问题,就是自己从零开始,一步一步地设计并完善一个模型。那具体应该怎么做呢?
2024-11-14 11:23:53
1052
原创 大模型有什么用?中国最懂模型的人是这么看的
月之暗面CEO杨植麟认为,大模型本质上是数据的压缩,但这个压缩可以产生智能,随着不断规模化模型,做更好的压缩,它能产生越来越多的智能。AGI现在并不一定需要精确的、量化的定义,它可能是一个定性的、感性的东西,它最重要的作用是能让所有人对接下来要发生什么事情有一个准备。百川智能CEO王小川。百川智能CEO王小川认为,现在到了AGI时代,有足够的科学家与资源参与进来,人类能够走向AGI。但是以现在的Scaling Law来看,这个事情还做不到AGI。AGI的定义在全球很难有一个完整的共识。
2024-11-14 11:17:16
884
原创 一文彻底搞懂大模型 - LLM的构建流程
*。需要不同规模的数据集、不同类型的算法,并会产出不同类型的模型,同时所需的资源也有显著差异。****什么是预训练?**算法与资源:利用由数千块高性能GPU和高速网络组成的超级计算机,花费数十天甚至数月的时间完成深度神经网络参数的训练,构建基础模型(Foundation Model)。这一阶段对计算资源的需求极大,结果:基础模型能够对长文本进行建模,具备语言生成能力,根据输入的提示词,模型可以生成文本补全句子。**为什么需要预训练?********。**********
2024-11-14 11:12:37
1014
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅