自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(649)
  • 收藏
  • 关注

原创 通往 LLM 算法工程师之路

大模型发展日新月异,本文仅梳理成为大模型算法工程师一些典型的技术,期望帮助大家在通往 LLM 算法工程师的道路上走的更扎实。

2024-09-29 14:25:17 897

原创 大模型催生新的热门职业:AI Engineer

在回答这个问题之前,我们需要再一起看一下大模型的一些特点。泛化能力:相比于之前 ML Engineer 针对特定业务场景训练出来的模型,大模型拥有更好的泛化能力,也就是说基于一个通用大模型,加上合适的提示、微调等,就能获得适配特定业务场景的模型能力。比如微软最开始放出 New Bing 的时候,大家就说其本质是 GPT-3 模型在搜索场景下的应用,而不是针对搜索场景重新训练的模型。另外比如 Jasper(AI 写作工具),也是大模型在写作场景下的泛化和应用。高门槛。

2024-09-29 14:23:48 957

原创 奔三理工男适合转行做AI算法工程师吗?

奔三男生转行可以做什么?干了几年开发程序员却面临降薪优化?说实话,如果学历一般技术一般,无法与时俱进的话,会容易面临尴尬情况……就业这件事,选对赛道方向至关重要!!这篇文章给所有迷茫、想要寻求好机会的男生一个转行好思路换个角度说不定会有新发现!!在2024年,男生如果想要稳定,不走编制和央国企,又要薪资可观的话,那么去狠扎技术,而且要选新兴赛道!!这里推荐▽▽【AI算法工程师】相对于程序员,AI算法工程师没有年龄“天花板”,工作按中长期项目推进,少了“急活”“杂活”,也高了“门槛”,“待遇薪资又能往上走走步

2024-09-29 14:21:50 842

原创 通透!机器学习各大模型原理的深度剖析!

通俗来说,机器学习模型就是一种数学函数,它能够将输入数据映射到预测输出。更具体地说,机器学习模型就是一种通过学习训练数据,来调整模型参数,以最小化预测输出与真实标签之间的误差的数学函数。机器学习中的模型有很多种,例如逻辑回归模型、决策树模型、支持向量机模型等,每一种模型都有其适用的数据类型和问题类型。同时,以联结主义的感知机为例,通过增加感知机的隐藏层数,我们可以将其转化为深度神经网络。而对感知机加入核函数就可以转化为SVM。这一过程可以直观地展示了不同模型之间的内在联系,以及模型间的转化可能。

2024-09-26 15:32:59 1341

原创 一文搞懂 AI智能体、大模型、提示词

提示词:在AI领域,特别是在自然语言处理(NLP)中,提示词是一种输入形式,用于引导或激发A!模型生成特定的输出。它是一种交互手段,帮助用户更有效地与模型沟通,获取所需信息或执行特定任务。AI智能体:智能体是一种具有一定智能的系统,能够感知其环境,做出决策,并在环境中执行行动。智能体可以是自主的,具有学习和适应的能力,能够执行复杂任务。

2024-09-26 15:29:25 915

原创 从零开始的认知,人工智能大模型原理及应用简析

图1 - 文心一言答呆萌问18世纪60年代到20世纪后半期,前三次工业革命贯穿了人类近代史,蒸汽机、内燃机、电机、计算机等各类新工具的出现,通过改变生产方式极大的提升了生产效率, 与之不同,我们正处于的第四次工业革命,涵盖了“人工智能、生物技术、信息技术、区块链等多个领域的技术突破和应用”,是将数字技术作为通用目的技术的复合型革命,涉及到制造业、能源、交通、医疗、农业等多个领域。2018年,OPEN AI所发布的 ChatGPT-1,通过对自然语言输入进行建模和预测,支持生成高质量的自然语言回复文本。

2024-09-26 15:27:01 772

原创 AI大模型入门:微调技术

微调(Fine-tuning)是一种在自然语言处理(NLP)中使用的技术,用于将预训练的语言模型适应于特定任务或领域。Fine-tuning的基本思想是采用已经在大量文本上进行训练的预训练语言模型,然后在小规模的任务特定文本上继续训练它。Fine-tuning的概念已经存在很多年,并在各种背景下被使用。Fine-tuning在NLP中最早的已知应用是在神经机器翻译(NMT)的背景下,其中研究人员使用预训练的神经网络来初始化一个更小的网络的权重,然后对其进行了特定的翻译任务的微调。

2024-09-26 15:24:48 1029

原创 AI Agent,将如何打破大模型的应用边界?

AI Agent通过海量文本数据学习,提升了知识的广度和深度,厂商通过自有行业数据训练,进一步增强了模型在垂直领域的深度。从主流厂商产品上来看,AI Agent在特定模块化功能、以及人工参与性强的功能上表现良好,但在全自动化和复杂推理任务上仍需改进。

2024-09-24 10:38:39 936

原创 开源大模型技术路线及趋势

因此,开源生态的竞争缩小到基础模型上面,学术机构、创业公司频繁交替开源更强的基础模型(比如aquila2-70B、xverse-65B、deepseek-67B),主流的顶尖模型已推进到70B的门槛。:转向大模型应用,包括agent、领域大模型25年甚至更早(24年底),meta会推出顶尖的多模态大模型llama3.1-v甚至llama4-v(阿里很可能推出qwen2-vl),届时,大部分学术机构及科技公司微调的多模态大模型将失去竞争力,大模型应用将广泛使用meta及阿里的开源多模态大模型。

2024-09-24 10:33:39 991

原创 必知!大模型背后的6大核心技术!

Transformer模型,无疑是大型语言模型的坚实基石,它开启了深度学习领域的新纪元。在早期阶段,循环神经网络(RNN)曾是处理序列数据的核心手段。尽管RNN及其变体在某些任务中展现出了卓越的性能,但在面对长序列时,它们却常常陷入梯度消失和模型退化的困境,令人难以攻克。为了解决这一技术瓶颈,Transformer模型应运而生,它如同黎明中的曙光,照亮了前行的道路。

2024-09-24 10:26:16 1098

原创 AI大模型入门指南

AI大模型是指拥有大量参数的机器学习模型,这些参数可以达到数十亿甚至数千亿。它们通过深度学习技术,能够处理和学习复杂的数据模式,执行语言理解、图像识别和自然语言处理等多种任务。在工作原理上,AI大模型基于深度神经网络架构,通过模拟人脑神经元的连接方式,从大量数据中学习规律。这些模型通过不断优化自身的参数,提高对各种输入的预测和响应的准确性。简而言之,AI大模型通过海量数据训练,不断学习并改进其性能,以达到或超越人类专家在特定任务上的表现。

2024-09-23 20:31:18 924

原创 28岁的程序员,如何转型做AI项目经理?

综上,要想成功转型为AI项目经理,需要具备扎实的算法基础、了解其主要工作原理和技术发展趋势,掌握基本的项目管理能力、高效的执行力、敏锐的洞察力、创新思维、团队合作和领导能力等多方面的素质。只有不断提升自己的综合能力,才能够在AI领域取得更大的成就。

2024-09-23 17:41:58 570

原创 35岁产品经理,转行新方向,薪资暴涨40%!

每天都是整理需求、开会、写文档、协调资源·被开发、运营diss一通,顺便为产品“背个锅”·熬夜加班做出来的产品,业务团队还是不愿意用……更让人头秃的是,干了3年,好像到了“职业天花板”,升职加薪的迹象一点没有,裁员的风声却与日俱增……上周偷摸面了个试,面试官上来就抛了一个问题:有没有做AI产品的经历?AI在B端和C端有哪些落地场景?AI算法工程师说你的需求实现不了怎么办……沉默片刻,一抬头,撞上面试官的眼神,我就知道我凉了……现在的产品人,都要求要会AI了?现在连中小企业都开始接入AI功能。

2024-09-23 17:37:16 990

原创 国产 AI 大模型混战,程序员的机会来了

这场向我们袭来的 AI 浪潮,有人欢喜有人忧,但总体上是让人们都有了危机感。所以哪怕 AI 大模型注定只会是一场存在于科技巨头之间的战役,却依旧不影响国内一众大中小厂纷纷踏入,甚至还掀起了一股 AI 创业热潮。国内大模型的涌现速度,比起大模型能力的涌现都“毫不逊色”。

2024-09-23 17:33:41 909

原创 AI产品经理薪资30k起步?0基础可以转行AI产品吗?

AI产品经理是对AI技术应用和功能落地负责,并为公司带来商业价值的一群人,主要集中在。

2024-09-20 16:24:08 1325

原创 AI产品经理:风口上的新宠

AI产品经理是一个跨学科、跨领域的综合性岗位,它要求从业者不仅要有扎实的技术基础,还要有敏锐的市场洞察力和卓越的项目管理能力。通过上述学习清单的系统学习,你将能够逐步构建起成为一名优秀AI产品经理所需的知识体系和技能。记住,持续学习和实践是通往成功的关键。祝你在AI产品经理的道路上一帆风顺!

2024-09-20 16:16:58 1026

原创 没有项目经验,如何快速转行AIGC产品经理?

根据脉脉显示:人工智能成为2022最缺人行业,⼈⼯智能⾏业的⼈才紧缺指数(⼈才需求量/⼈才投递量)为0.83,也就是说这个领域人才缺口巨大且没那么卷。而且随着ChatGPT4.0的大火,这种趋势在2023年强势蔓延,而且薪资水平还不错。。我最近跟小米、百度的资深AI产品沟通,他们反馈:在大量招人,只要有AI相关的项目经验,学历别太差就能拿到面试机会。而且领导很舍得给钱,涨薪40-60%很正常。。可以看到热招岗位排行前10名中8个研发岗位,2个产品岗位。[数据来源:脉脉高聘人才智库]

2024-09-20 16:15:28 875

原创 一文讲明白初学者怎么入门大语言模型(LLM)?

关于如何入门LLM,大多数回答都提到了调用API、训练微调和应用。但是大模型更新迭代太快,这个月发布的大模型打榜成功,仅仅过了一个月就被其他模型超越。训练微调也已经不是难事,有大量开源的微调框架(llamafactory、firefly等),你只要懂部署,配置几个参数就能启动训练。甚至现在有大量云上项目,你根本不需要部署,直接上传数据,就能启动。这我让想起来之前的算法工程师都被调侃成调参师,新出一个大模型,下载下来跑一遍,运行一遍,对于自己理解和入门大模型没有任何意义。

2024-09-17 07:00:00 806

原创 LLM大模型入门

我们先了解什么是大语言模型。大语言模型是一种基于深度学习的自然语言处理技术,它可以通过学习大量的文本数据,生成连贯、有逻辑的文本。大语言模型在许多领域都有广泛的应用,如文本生成、机器翻译、情感分析等。入门步骤1. 学习基础知识首先,我们需要学习一些基础知识,包括机器学习、深度学习、自然语言处理等。这些知识将为我们学习大语言模型打下坚实的基础。编程语言:大多数LLM相关的库和框架都是用Python编写的,因此掌握Python是必不可少的。开发环境。

2024-09-17 07:00:00 809

原创 多模态大模型入门指南

如表1所示,对26 SOTA MM-LLMs的架构和训练数据集规模进行了全面比较。随后,简要介绍这些模型的核心贡献并总结了它们的发展趋势。代表了一系列视觉语言 (VL) 模型,旨在处理交错的视觉数据和文本,生成自由格式的文本作为输出。(2)BLIP-2引入了一个资源效率更高的框架,包括用于弥补模态差距的轻量级 Q-Former ,实现对冻结 LLMs 的充分利用。利用 LLMs,BLIP-2 可以使用自然语言提示进行零样本图像到文本的生成。(3)LLaVA。

2024-09-16 09:00:00 877

原创 突发!OpenAI发布最强模型o1:博士物理92.8分,IOI金牌水平

来了来了!OpenAI新模型无预警上新:o1系列,可以进行通用复杂推理,每次回答要花费更长时间思考。在解决博士水平的物理问题时,GPT-4o还是“不及格”59.5分,o1一跃来到“优秀档”,直接干到92.8分!没错,传说中的「草莓」,终于来与大家见面了!CEO奥特曼称它是一种新范式的开始:可以进行通用复杂推理的人工智能。具体来说,o1系列是OpenAI首个经过强化学习训练的模型,在输出回答之前,会在产生一个很长的思维链,以此增强模型的能力。换句话说,内部思维链越长,o1思考得越久,模型在推理任务上的表现就越

2024-09-16 08:00:00 1522

原创 吴恩达大神珍藏版:《LLM大模型通关手册》面面俱到太全了!

LLM 正在逐步改变人们的生活,而对于开发者,如何基于 LLM 提供的 API 快速、便捷地开发一些具备更强能力、集成LLM 的应用,来便捷地实现一些更新颖、更实用的能力,是一个急需学习的重要能力。这本由吴恩达教授与OpenAI联合推出的《LLM大模型通关课程手册》,从理论到实践带你全方位掌握大模型技术,一共373页PDF,从基础知识到高级应用一一为你剖析。

2024-09-16 07:00:00 1791

原创 解锁AI新纪元:如何用好大语言模型?

在20世纪末和21世纪初,⼈类经历了两次信息⾰命的浪潮:第⼀次是互联网时代的兴起,将世界各地连接在⼀起,改变了⼈们获取信息和交流的⽅式。第⼆次则是移动互联网时代的到来,智能⼿机和移动应⽤程序的普及使⼈们可以随时随地与他⼈交流、获取信息和进⾏商务活动。然⽽,随着技术的不断演进和⼈类社会的不断发展,我们正站在另⼀个信息时代的⻔槛上。这是一个更加智能化、更加联系紧密的时代,它将重新定义我们与世界互动的方式,塑造我们的生活、工作和社会关系。0 1如何入门大语言模型?初学者→进阶者之路体验先进模型:使用最新模型以理解

2024-09-15 09:00:00 948

原创 大模型二次开发基本思路

(Continue PreTraining)增量预训练在大模型整个流程中,增量预训练是属于后期预训练(Post-pretraining)的范畴。Post-pretraining(后期预训练)是一种在模型的初始预训练和最终微调之间进行的训练方法。这种方法通常用于进一步适应模型以处理特定类型的数据或任务。以下是详细介绍,参考了之前对SFT和RLHF的描述方式:1、后期预训练(Post-pretraining)

2024-09-15 08:00:00 878

原创 大模型入门基础概念介绍

人类的语言是由文字构成,语言的含义也是由单词构成的,即单词是含义的最小单位。因此,为了让计算机理解自然语言,寻找数字表示的方法是第一步。⾃然语⾔是⽤来表达⼈脑思维的复杂系统。在这个系统中,词是意义的基本单元。顾名思义,词向量是⽤于表⽰单词意义的向量,并且还可以被认为是单词的特征向量或表⽰。将单词映射到实向量的技术称为词嵌⼊。

2024-09-15 07:00:00 846

原创 普通人也能看懂的大语言模型入门,不要错过哦

但首先,让我们从一些你可能经常听到的基本术语开始。什么是人工智能?•人工智能:一个实体,如果人类做类似的事情,人们可能会合理地称之为智能的行为。使用“智能”这个词来定义人工智能有点问题,但没有人能就“智能”的好定义达成一致。然而,我认为这种定义仍然相当合理。它基本上是说,如果我们观察到一些人造的东西,它做的事情既吸引人又有用,而且看起来有些非平凡,那么我们可能会称之为智能。例如,我们经常将“AI”这个术语归因于电脑游戏中的电脑控制角色。

2024-09-14 09:00:00 764

原创 走进大模型:大模型训练指南

在人工智能的浩瀚浪潮中,大模型如同一股不可小觑的力量,正以前所未有的方式重塑着技术的边界与应用的广度。这些模型,以其庞大的参数规模、复杂的网络结构以及强大的学习能力,在诸多领域展现出了令人瞩目的优异性能。从自然语言处理到计算机视觉,从语音识别到跨模态理解,大模型几乎覆盖了人工智能应用的每一个角落,引领着技术发展的新风尚。今天,让我们一起走进大模型,了解大模型是如何训练出来的。当我们需要一个专业领域的 LLM 时,预训练模型中的知识就尤为重要。

2024-09-14 08:00:00 1118

原创 AI大模型知识点大梳理

文章介绍了AI大模型的概念,它们是具有大量参数的深度学习模型,在自然语言处理等领域取得突破。文章还列举了各大公司如OpenAI、Google、百度等的发展历程,阐述了大模型的底层原理,包括神经网络和数据训练过程,并讨论了它们的优点如准确性、智能性,以及不足如计算资源需求高、可解释性差。此外,文章还提到了AI大模型对经济、就业、隐私和伦理等方面的社会影响。AI大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。

2024-09-14 07:00:00 1319

原创 OpenAI 大神亲授,人人都能看懂的大模型入门教程

这是来自 AI 界世界级导师,OpenAI top 级人物 Andrey Karpathy 的大语言模型入门讲座,讲座主题是 The busy person’s intro to LLMs,可以说这就是能看到的最好的大模型入门教程了,老少咸宜,业内工作者可以看到大模型里涉及到的各个可以深挖的方向,对于感兴趣的业外人士,讲座内容也非常浅显易懂且全面。讲座的原始视频发表在其 youtobe 的个人账号里:https://www.youtube.com/watch?

2024-09-13 17:12:59 859

原创 学大模型必看!手把手带你从零微调大模型!

今天分享一篇技术文章,你可能听说过很多大模型的知识,但却从未亲自使用或微调过大模型。大模型微调本身是一件非常复杂且技术难度很高的任务,因此本篇文章仅从零开始,手把手带你走一遍微调大模型的过程,并不会涉及过多技术细节。希望通过本文,你可以了解微调大模型的流程。微调大模型需要非常高的电脑配置,比如GPU环境,相当于你在已经预训练好的基础上再对大模型进行一次小的训练。但是不用担心,本篇文章会使用阿里魔塔社区提供的集成环境来进行,无需使用你自己的电脑配置环境。

2024-09-13 16:02:48 871

原创 终于!有人总结了大模型学习资料!

大家好,我发现了一个大模型学习的神库,包含大量LLM教材和资料,并绘制了学习路线图。可以帮助快速掌握大模型的应用和开发技巧。

2024-09-13 15:58:39 1416

原创 大模型技术学习过程梳理

‍‍‍‍‍‍‍从大的方向上来说,大模型从技术到应用,主要涉及到以上几个大的模块;而每个模块又涉及到大量的技术和细节。比如打造不同任务的神经网络模型,强化学习,迁移学习,知识蒸馏,分布式训练与存储等;以及RAG使用的向量检索,向量数据库,语义理解等,还有复杂任务的思维链(CoT),模型训练使用的LoRa等微调方法。还有多模态模型中的知识对齐,数据融合等复杂技术。‍‍‍基于大模型开发的人工智能机器人,感兴趣的可以点击查看:

2024-09-13 15:52:46 981

原创 LLM大模型技术实战:大白话带你入门深度学习

我们通过算术学习、手写数字识别了解了什么是深度学习,也用TensorFlow2实现了手写数字识别,从整体上了解了一个深度学习程序是什么样子的,应该有哪些步骤读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型。

2024-09-09 11:14:31 1141

原创 从零开始:大模型入门指南

模型参数是构成机器学习模型和深度学习模型的基本C元素,它们决定了模型如何从输入数据映射到预测输出。在训练过程中,模型参数通过学习数据集中的模式和关系进行调整,以便模型能够准确地执行分类、回归、特征提取等任务。1.权重(Weights):权重是模型中最重要的参数,它们决定了输入数据如何影响最终的预测结果。在神经网络中,权重类似于生物神经元之间的连接强度。2.偏置(Biases):偏置是加在每个神经元输出上的一个常数,用于调整输出的水平位置,以便更好地拟合数据。

2024-09-09 11:11:40 1079

原创 AI大模型基础入门

一、介绍随着人工智能技术的迅猛发展,AI大模型在各个领域中展现出了巨大的潜力和应用价值。近年来,诸如GPT-4、BERT等大型语言模型(Large Language Models, LLMs)成为了学术界和工业界的热点话题。这些大模型不仅在自然语言处理(Natural Language Processing, NLP)领域取得了突破性进展,还在计算机视觉、医疗健康、金融科技等多个领域中广泛应用,显著提升了各类智能系统的性能和智能化水平。AI大模型的崛起与深度学习和神经网络技术的发展密不可分。

2024-09-09 11:07:52 1547

原创 LangChain系列使用指南:LangChain快速入门

并假定读者也在使用。我们仅涉及了提示、模型和输出解析器的基础知识 - 要深入了解这里提到的所有内容,请参阅文档的此部分。大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。我们将展示如何使用通过 API 提供的模型,如 OpenAI,以及本地开源模型,使用像 Ollama 这样的集成。

2024-09-06 21:11:27 1214

原创 大模型学习基础知识

一、知识体系架构二、什么是AI三、大模型能干什么大模型,全称「大语言模型」,英文「Large Language Model」,缩写「LLM」。需要分清和从公司产品的评论中,分析哪些功能/元素是用户讨论最多的,评价是正向还是负向检查客服/销售人员与用户的对话记录,判断是否有争吵、辱骂、不当言论,话术是否符合标准让大模型基于私有知识回答问题自动规划任务,生成指令,自动执行用 AI 编写代码,提升开发效率。

2024-09-05 14:24:09 961

原创 探索AI大模型学习的未来之路

随着大数据时代的到来,AI大模型学习已成为机器学习领域的研究热点。大型模型在处理复杂任务时表现出色,为各个领域带来了前所未有的机遇。本文旨在深入探讨AI大模型学习的理论基础、优化技巧、应用实例以及未来发展趋势,以期为相关研究和实践提供有益的参考2.1 深度学习AI大模型学习建立在深厚的数学和算法基础之上。其中,深度学习技术是支撑大模型学习的重要基石。深度学习模型通过模拟人脑神经元的连接方式,构建出具有强大表示学习能力的网络结构。这些模型能够自动地从大量数据中提取特征,并学习到数据的内在规律和模式。

2024-09-05 14:18:04 1052

原创 LLM大模型基础知识学习总结

但是,在AI Agent时代,很多情况下不需要把这些指令一个一个地指出来,只需要一句话就行了,比如说提供一个prompt“请帮我完成一个用户系统,它包含用户注册、登录、查询等功能”,然后大模型就会帮你去完成。这个生成的过程我们叫做面向目标的架构,具有。

2024-09-05 14:16:27 1187

原创 大语言模型(LLMs)全面学习指南

大语言模型(LLMs)作为人工智能(AI)领域的一项突破性发展,已经改变了自然语言处理(NLP)和机器学习(ML)应用的面貌。这些模型,包括OpenAI的GPT-4o和Google的gemini系列等,已经展现出了在理解和生成类人文本方面的令人印象深刻的能力,使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……大语言模型(LLMs)是一种深度学习模型,专门设计用于理解、分析和生成类似人类的文本。

2024-09-05 14:10:41 1057

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除