自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(780)
  • 收藏
  • 关注

原创 神仙级AI大模型入门教程(非常详细),从零基础入门到精通,从看这篇开始!

一份系统的技术路线图,详尽的全套学习资料,不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点,还能提供一条高效、有序的学习路径。我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下。虽然大模型在底层运算上可能不如一些特定的算法快速,但大模型清晰的结构和强大的能力能够解放开发者的大量时间,同时也能方便地与其他技术(如传统机器学习算法)结合使用。那么,为什么要学习大模型呢?

2024-12-06 18:58:11 771

原创 【AI大模型】AI Agent 智能体的6个能力级别剖析

这里展示了 AI Agent 智能体的6个级别,从最基础的规则驱动系统到潜在的超级智能,逐步提升了 AI 的能力和应用范围。每个级别的性能与功能均依赖于不同的技术手段,展示了 AI 逐渐从简单的任务自动化向复杂的、自主学习的系统发展。

2024-12-06 11:00:01 931

原创 一文读懂:人工智能、区块链、元宇宙、自然语言处理的内涵、意义与特点

在快速发展的科技时代,前沿技术正以前所未有的速度推动着各行各业的变革。人工智能、区块链、元宇宙等技术不仅重新定义了商业模式和社会交互方式,更在医疗、金融、教育等领域引发深刻变革。本文将探讨这些前沿技术及其应用前景,展望它们如何塑造未来的数字化世界。

2024-12-05 20:05:03 934

原创 史上最全 BAT 大厂AI大模型面试1000题整理!(速度收藏)

刷题,是面试前的必备环节。想要入职大厂可谓是千军万马过独木桥。为了通过层层考验,刷题肯定是必不可少的。鉴于此大厂多年经验技术面试官总结根据BAT AI大模型面试1000题系列,结合各个大厂的面试题型整理了一份《AI大模型面试刷题宝典》,为了阅读体验,面试题都按知识点整理好了,可谓非常用心了。每一章节都是站在企业考察思维出发,作为招聘者角度回答。从考察问题延展到考察知识点,再到如何优雅回答一面俱全,可以说是求职面试的必备宝典,每一部分都有上百页内容,接下来具体展示,完整版可直接下方扫码领取。

2024-12-05 19:45:29 412

原创 【AI大模型实战】给Java同仁单点的AI“开胃菜“--搭建一个自己的本地问答系统

大家好,因为对AI大模型很感兴趣,相信很多兄弟们跟我一样,所以最近花时间了解了一些,有一些总结,分享给大家,希望对各位有所帮助。 本文将讲解如何在本地搭建一个简易的AI问答系统,主要用java来实现,也有一些简单的python知识;网上很多例子都是以 ChatGPT来讲解的,但因为它对国内访问有限制,OpeAi连接太麻烦,又要虚拟账号注册账号啥的,第一步就劝退了,所以选择了 llama和qwen替代,但是原理都是一样的。

2024-12-04 19:18:45 988

原创 AI大模型时代,适合年轻人就业的新兴岗位大盘点!!

随着人工智能技术的飞速发展,尤其是大型语言模型(LLMs)和深度学习模型的应用日益广泛,AI大模型正逐渐改变着各行各业的工作方式。对于年轻人来说,这是一个充满机遇的时代,许多新的职业岗位正在涌现。本文将探讨在AI大模型时代,哪些岗位特别适合年轻人就业,并为他们提供一条清晰的职业发展路径。AI大模型时代的到来,为年轻人带来了前所未有的职业机遇。无论是技术型岗位还是非技术型角色,都有各自的特点和发展前景。关键在于找到最适合自己的方向,并持续学习和积累经验。

2024-12-04 19:02:26 472

原创 【AI大模型】构建生产级 RAG 系统前,必须搞懂的 7 个核心问题

生产级 RAG 应用的开发是一项系统化工程,需要结合检索优化、模型调整、性能评估等多个环节。开发者可以从简单的开源工具(如 LangChain 或 Haystack)入手,快速搭建原型系统,并通过微调和性能优化迭代出高质量的解决方案。下一步行动:如果您也想构建属于自己的 RAG 系统,不妨从设计数据摄取管道开始,通过逐步优化,探索这项技术的潜力。因为这个行业不同于其他行业,知识体系实在是过于庞大,知识更新也非常快。

2024-12-03 19:30:03 938

原创 AI 发展真的会让大部分人失业吗?普通人如何用 AI 提升工作效率?

随着人工智能(AI)技术的迅猛发展,越来越多的人开始担心AI是否会取代人类的工作,导致大规模失业。然而,AI的发展并非全是负面影响,它也为提升工作效率和创造新的就业机会带来了巨大的潜力。本文将探讨AI对就业的影响,并提供一些实用的方法,帮助普通人利用AI提升工作效率。AI的发展确实会对某些传统职业造成冲击,但同时也为提升工作效率和创造新的就业机会带来了巨大的潜力。作为普通人,我们可以通过学习和掌握AI工具,提升自己的工作效率,适应新的工作环境。

2024-12-03 11:50:24 550

原创 随着AI发展,未来30年内程序员会一直是一个好的职业吗?

随着人工智能(AI)技术的飞速发展,许多行业正面临着前所未有的变革。对于程序员而言,AI不仅将改变他们的工作方式,还将重塑整个职业生态。确实,随着AI的发展,一部分工作会被取代,尤其是那些初级程序员的工作。然而,未来能留在程序员岗位上的,必将是所谓的“超级程序员”——不仅技术过硬,而且业务能力也非常专业。总而言之,未来的程序员职业将经历一场深刻的变革。只有那些能够充分利用AI大模型、具备深厚技术和专业业务能力的“超级程序员”才能在未来的职场中立足。

2024-12-02 19:59:43 743

原创 【AI大模型】一文说清楚人工智能的嵌入(Embedding)是什么

Embedding 是一种机器学习概念,用于将数据映射到高维空间,将语义相似的数据放在一起。Embedding模型通常是 BERT 或其他 Transformer 系列中的深度神经网络,可以用一系列称为向量(vectors)的数字有效地表示文本、图像和其他数据类型的语义。这些模型的一个主要特点是,向量之间在高维空间中的数学距离可以表示原始文本或图像语义的相似性。这一特性开启了许多信息检索应用,如谷歌和必应等网络搜索引擎、电子商务网站上的产品搜索和推荐,以及最近流行的生成式人工智能中的检索增强生成(RAG)范

2024-12-02 19:40:23 705

原创 大模型产品架构全景解读:从应用场景到技术支持的完整路径

随着人工智能技术的迅猛发展,大模型逐渐成为推动各行业智能化转型的核心动力之一。大模型不仅可以处理大量数据,进行复杂任务的自动化,还能通过微调、蒸馏等技术在特定场景中表现出色。本文将结合大模型产品架构图,详细解读每一个组成模块,帮助读者理解从应用场景到技术支持的完整路径,洞察大模型如何在实际业务中落地。

2024-12-01 08:30:00 1015

原创 如何速成RAG+Agent框架大模型应用搭建?看完这一篇文章你就会了!!!

目前有关大模型的定义与算法介绍的文章已经很多,本文侧重于能力总结和实操搭建部分,从大模型应用的多个原子能力实现出发,到最终串联搭建一个RAG+Agent架构的大模型应用,让个人对于大模型应用如何落地更加具有体感。

2024-11-30 21:39:46 662

原创 一文搞懂 AI智能体、大模型、提示词

它指的是使用人工智能技术自动生成文本、图像、音频、视频等内容的过程。AIGC技术可以应用于多种场景,包括但不限于:文本生成:自动撰写新闻报道、生成创意写作、自动回答用户问题等。图像生成:创建艺术作品、设计图案、生成用户定制的图片等。音频生成:合成语音、生成音乐、制作有声读物等。视频生成:自动剪辑视频、生成动画、制作虚拟角色等。

2024-11-30 21:35:09 799

原创 AI大模型技术发展,带来了5个巨变,彻底打破了产品经理的从业门槛!!

强烈建议,打算从事或已从事产品经理岗的同学,去系统学习下AI大模型技术。AI大模型技术发展,带来了5个巨变,彻底打破了产品经理本就不高的从业门槛,普通人都能成为产品经理的时代真的要来了!

2024-11-29 19:42:08 309

原创 【AI大模型】SFT之后为什么需要RLHF?又被问住了

SFT 不够吗?为什么需要 RLHF?这是一道很普遍的面试题,如果能深入理解一下 ChatGPT 两阶段训练背后真正的动机是什么,那么心中自然会有答案了。我恰好在多种情境中实践过模仿学习、强化学习以及逆强化学习,熟悉它们之间的不同组合方式。因此,我想要分享我的一些经验和想法。这些观点可能并不完全正确,但我希望它们能为你带来一些灵感。接下来我会从动机的角度切入,依次介绍两阶段训练的内容。直至最后得出结论。

2024-11-29 17:04:18 645

原创 NLP大牛Thomas Wolf的新书《Transformer自然语言处理实战》,466页pdf

自2017年推出以来,Transformer已迅速成为在各种自然语言处理任务上实现最先进结果的主导架构。Transformers 已经被用来编写真实的新闻故事,改进谷歌搜索查询,甚至创造出讲笑话的聊天机器人。在本指南中,作者Lewis Tunstall、Leandro von Werra和Thomas Wolf(拥抱Transformers 的创始人之一)使用亲身实践的方法来教你Transformers如何工作,以及如何将它们集成到应用程序中。你会很快学到他们能帮你解决的各种任务。

2024-11-28 14:19:25 363

原创 【AI大模型面试】豆包终面问我LLM原理,成功上岸...

最近平时工作可以说是把脑子想“干”了,所以花大概三个周末完成了这篇接近2w字的文章。写完感觉有很多不足,但还是随便找个时间发了吧。其一是,本来是打算从Llama 3这种优质开源模型和报告出发,进行一些知识上的梳理,结果行文时几乎保留了论文原来的结构,导致前一个知识点到下一个知识点不够丝滑;其二是,由于水平不够和“综合性”考量的限制,所以对很多需要深入的知识没有详尽。后面几个周末也许还会持续迭代一下本文,主要是继续细化技术点。所以也恳请诸位指出错误或不足,尽情提出需要补充内容的部分。

2024-11-28 11:24:51 620

原创 【最新】2024医疗人工智能报告:生成式AI爆发,医疗AI走到新的十字路口(附PDF)

快速发展的大语言模型,携着生成式AI掠过医疗领域。过往的互联网医疗、医学影像、新药研发……一个一个场景经由新一代AI重塑,焕发出前所未有的价值。近日,医疗行业媒体动脉网与蛋壳研究院聚焦“场景”与“产品”,整理、分析先驱者们的实战案例,发布了《2024医疗人工智能报告:生成式AI爆发,医疗AI走到新的十字路口》(以下简称“报告”)。其中,医渡科技“大数据+大模型”双中台解决方案作为标杆案例被报告收录,同时报告还深入剖析提炼了公司商业化进展及成功的商业化经验。

2024-11-27 19:31:43 795

原创 鹅厂面试官:Transformer为何需要位置编码?

本文基于 llama 模型的源码,学习相对位置编码的实现方法,本文不细究绝对位置编码和相对位置编码的数学原理。大模型新人在学习中容易困惑的几个问题:为什么一定要在 transformer 中使用位置编码?相对位置编码在 llama 中是怎么实现的?大模型的超长文本预测和位置编码有什么关系?为了助力朋友们跳槽面试、升职加薪、职业困境,提高自己的技术,本文给大家整了一套涵盖AI大模型所有技术栈的快速学习方法和笔记。目前已经收到了七八个网友的反馈,说是面试问到了很多这里面的知识点。

2024-11-27 10:29:17 1004

原创 谁说35岁是产品经理的中年危机?那是他还不知道这些新路子

作为一名工作十多年的产品经理,这个问题曾深深困扰我。今年35+岁的我仍然奋战在某上市公司的产品岗。从我个人的经历以及身边产品经理们的经历来看,结合网络上的就业数据,35岁之后的产品经理仍然有广阔的未来。事实上,真正从事“滴滴司机、送外卖、送快递”铁人三项的非常少。就业现状大致是:晋升管理岗(10%)、继续做产品经理(50%)、转行AI产品经理(15%)、转行其他岗位(20%)、创业当老板(5%)(占比未必百分百精确,但能代表一个整体的状态)。35岁之后的产品经理仍然有广阔的未来。

2024-11-26 18:53:55 873

原创 【AI大模型】LLM性能优化中的一些概念扫盲,看到就是赚到!!!

KV Cache的大小取决于模型大小(dim和layers) 和序列长度。为了尽可能的支持更大的模型、或者更长的序列,就需要对kv 进行压缩,下面列举一些方法对MHA的参数量进行压缩,从而对kv Cache进行压缩。

2024-11-26 10:57:13 539

原创 【研究报告】2024大模型人才报告-大模型行业平均月薪4.8万(附报告PDF)

《2024大模型人才报告》由脉脉高聘人才智库发布,指出大模型领域未现“抢人大战”,整体人才饱和,部分技术岗位紧缺。大模型五虎员工规模均在数百人,技术研发人才占多数。大模型相关内容热度持续增长,人才集中在一线城市,北京领先。整体人才供大于求,新发岗位平均月薪小幅上涨,招聘高峰在3月,算法工程师等高技术岗位紧缺,云计算人才最紧缺。互联网大模型岗位需求居首,字节跳动、小红书等企业在大模型人才招聘中表现突出,大模型高薪岗位分布广泛。近3成新发岗位要求硕博学历,远超新经济行业平均水平。

2024-11-25 17:48:35 508

原创 斯坦福&哈佛医学院MMedAgent:多模态医疗AI智能体,模型、数据、代码均开源

多模态大型语言模型(MLLMs)尽管取得了一些成功,但其通用性有限,常常在与专用模型的对比中显得不足。最近,基于LLM的智能体被开发出来以解决这些问题,通过根据用户输入选择合适的专用模型作为工具。然而,这些进步在医学领域尚未被广泛探讨。为了填补这一空白,本文首次引入了一种明确为医学领域设计的智能体,称为多模态医学智能体(MMedAgent)。为此,我们策划了一个包括六种医疗工具和在五种模态中解决七个任务的数据集,从而使智能体能够为给定任务选择最合适的工具。

2024-11-25 10:56:45 828

原创 必知!AI大模型背后的6大核心技术!

Transformer模型,无疑是大型语言模型的坚实基石,它开启了深度学习领域的新纪元。在早期阶段,循环神经网络(RNN)曾是处理序列数据的核心手段。尽管RNN及其变体在某些任务中展现出了卓越的性能,但在面对长序列时,它们却常常陷入梯度消失和模型退化的困境,令人难以攻克。为了解决这一技术瓶颈,Transformer模型应运而生,它如同黎明中的曙光,照亮了前行的道路。

2024-11-24 08:00:00 734

原创 大家都在说的AI大模型微调到底是什么?最易懂的AI知识科普!一篇为你解决对“微调”所有的疑问

当我们谈论AI,谈论人工智能领域时,经常会提到“模型微调”。这个词儿听起来可能有些专业,但它的的确确是解锁AI强大潜力,让AI更加精准地服务于我们的需求,推动人工智能落地的关键。那么,究竟什么是模型微调?我们为什么需要对模型进行微调?它的作用表现在哪些方面?目前又有哪些主流的微调的方法呢?今天,我们就用最白话的方式,带大家了解下这个“微调”,到底是在说什么?

2024-11-23 11:58:39 736

原创 0成本5分钟!利用开源大模型搭建本地专属AI知识库

你一定经历过各种通用大模型一本正经胡说八道的时候吧,AI一通丝滑输出让人真假难辨,防不胜防。这种情况被称为**AI幻觉**。大模型产生幻觉不幸“翻车”的原因很大程度上是 **“先天不足”**,例如训练时来自特定领域的训练数据就比较缺失或存在偏差等。对于企业,AI的幻觉已经成为阻碍其落地应用的严重缺陷。我们自然想让一些企业内部私有数据也进入到大模型推理分析的过程,让其更好服务于日常业务,但出于信息安全等考量,私有数据显然不可随意上传到第三方平台。针对这种情况,将企业内部知识库和大模型连接起来构建一个*

2024-11-23 11:38:54 779

原创 35岁程序员如何精通AI技术,拥抱大模型,成为公司争相追捧的技术大牛?

随着人工智能的发展,越来越多的人开始关注并尝试学习AI。不少人认为,AI的学习需要很高的专业知识背景和年轻的脑力。然而,作为一个35岁的人,真的来得及学习AI并用好它吗?答案是肯定的!本文将详细探讨这个问题,帮助大家打破对年龄的顾虑,勇敢迈出学习AI的第一步。总之,35岁并不是学习和应用AI技术的终点,反而是新的起点。对于那些希望在AI领域有所作为的人来说,年龄并不是障碍,相反,多年的工作经验可能会成为他们的一大优势。只要你愿意投入时间和精力,不断学习和实践,就能够在这个充满机遇的时代找到属于自己的位置。

2024-11-22 19:45:31 560

原创 揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷

尽管以 MLP 和 Transformer 为代表的基础模型已经取得了显著的成功,但是它们却在周期性建模方面存在潜在的缺陷。即使面对简单的正弦函数,现有基础模型也难以理解其中的周期性规律,在外推时表现出完全失控的状态,未能有效捕捉到周期性现象的本质。

2024-11-22 11:51:41 1005

原创 大家都在说的AI大模型微调到底是什么?最易懂的AI知识科普!一篇为你解决对“微调”所有的疑问

当我们谈论AI,谈论人工智能领域时,经常会提到“模型微调”。这个词儿听起来可能有些专业,但它的的确确是解锁AI强大潜力,让AI更加精准地服务于我们的需求,推动人工智能落地的关键。那么,究竟什么是模型微调?我们为什么需要对模型进行微调?它的作用表现在哪些方面?目前又有哪些主流的微调的方法呢?今天,我们就用最白话的方式,带大家了解下这个“微调”,到底是在说什么?

2024-11-21 19:40:31 501

原创 【AI大模型】Prompt压缩:提升大型语言模型效率的关键技术

Prompt压缩是指将长而复杂的提示文本简化为更短、更精炼的形式,以便在保持原始意图的同时,提高LLMs的处理效率和准确性。这种技术的重要性主要体现在以下几个方面:提高处理效率:LLMs 由于计算资源的限制,对能够处理的最大标记(token)长度有一定限制。通过压缩 Prompt,可以在这些标记限制内容纳更多信息,从而最大化 LLM 计算资源的效率。例如,一个较长的关于特定主题的 Prompt 可能无法完整输入到语言模型中,但经过压缩后,可以在不丢失关键信息的情况下符合标记长度要求。

2024-11-21 11:38:26 1008

原创 大模型引领AI新时代:从GPT到“人工智能+”

随着科技的飞速发展,人工智能(AI)已成为引领新一轮科技革命和产业变革的重要驱动力。大模型(Large Language Models, LLMs)作为AI领域的一项革命性突破,正以前所未有的速度重塑着我们对智能交互、知识管理、内容创作乃至整个数字化世界的认知。近年来,诸如GPT系列、Sora等大模型的不断涌现,不仅展示了AI在自然语言处理领域的巨大潜力,也预示着AI技术即将迈入一个更加复杂、细腻且广泛适用的新纪元。面对AI大模型开发领域的复杂与深入,精准学习显得尤为重要。

2024-11-20 11:16:09 976

原创 【AI大模型】Transformer为什么一定要添加一个Positional Encoding模块?

之前老喜欢死记硬背transformer的网络架构,虽然内容并不复杂,但是发现这个transformer模块中的positional encoding在死记硬背的情况之下很容易被忽略。为了更好地理解为什么transformer一定需要有一个positional encoding,简单推了一下公式

2024-11-20 11:09:04 825

原创 33岁了,想转行AI大模型还来得及吗?

在当今快速发展的科技环境中,人工智能(AI)特别是大模型领域正变得越来越重要。对于许多人来说,33岁可能是一个关键的年龄节点,它既意味着成熟与稳定,也可能伴随着对未来的不确定性和职业发展的重新评估。那么,对于那些想要在这个年纪转行进入AI大模型领域的人来说,是否还来得及呢?

2024-11-19 18:54:58 689

原创 AI应用落地:大模型如何实现商业化路径、推动新质生产力发展?

大模型的商业化路径在企业市场主要通过基础费用、模型精调、部署和云服务等方式实现。尽管目前价格战激烈,但这有助于降低试错成本,加速企业产品落地。通过与云服务提供商合作和技术优化,企业仍可以实现收入增长。

2024-11-19 11:30:15 1090

原创 大龄程序员与其苦苦挣扎,不如投身到AI大模型!!

在全球范围内,人工智能(AI)技术的迅速发展正在引领新一轮的技术革命。随着AI技术的广泛应用,相关岗位的需求量激增,为大龄程序员提供了新的职业发展机会。对于那些希望在职业生涯中寻求新方向的大龄程序员来说,结合自己的编程基础,学习机器学习、深度学习算法,并投身于人工智能的研发与应用,是一个极具吸引力的选择。

2024-11-18 19:09:31 407

原创 LLM实践系列-聊聊大模型SFT的数据清洗过程有多繁琐?

前段时间在清洗 sft 的数据,不得不说这工作是真磨人啊,细节多到让人抓狂。可能,这就是为什么从业者们都懂得 llm 的方法论,却依然没几个团队能造出好数据训出好模型吧。

2024-11-18 14:11:19 939

原创 超强总结,AI大模型八种解决过拟合的技巧!!

当模型在训练数据上表现良好,但对未见数据的泛化效果不佳时,就会出现过拟合的现象。过拟合是机器学习中一个非常常见的问题,已有大量文献致力于研究防止过拟合的方法。下面,我将介绍八种缓解过拟合的简单方法,每种方法只需对数据、模型或学习算法进行一次修改即可。

2024-11-17 08:00:00 1008

原创 【AI大模型微调】垂直领域大模型微调实践经验最全总结

本篇从基座模型选择、模型整体架构、数据设计、训练微调四个角度总结垂直领域大模型微调经验。本篇将现有垂类大模型微调已公布的实践经验做一个全面的总结,大部分经验实测可推广,大家在自己实践过程中可以进行适当参考。

2024-11-16 08:00:00 851

原创 大模型微调七步法:让模型更懂你

近年来,自然语言处理 (NLP) 领域取得了重大进展,这主要得益于 OpenAI 的 GPT 系列等大型语言模型 (LLM) 的涌现。这些强大的模型彻底改变了我们处理自然语言任务的方式,在机器翻译、情感分析和自动文本生成等方面取得了突破性进展。由此催生了大量与自然语言处理相关的 AI 初创团队和产品。

2024-11-15 11:30:59 1018

原创 AI大模型技术的发展与就业前景:把握AI新阶段,迎接广阔未来

2022年末,随着ChatGPT的横空出世,大模型技术正式步入历史舞台,成为人工智能领域的一股强劲力量。这项技术的出现,标志着人工智能进入了新的发展阶段,人类向通用人工智能迈进了一大步。在短短两年的时间里,大模型技术不仅在学术界引发了广泛的研究热潮,也在工业界取得了显著进展,展现出巨大的应用潜力和市场前景。对于想要进入人工智能领域或寻求职业转型的专业人士而言,学习和掌握大模型技术无疑是极具吸引力的选择。无论是从技术发展潜力、市场需求还是职业发展前景的角度来看,大模型技术都展现出了不可估量的价值。

2024-11-15 11:26:16 767

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除