自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(49)
  • 收藏
  • 关注

原创 大语言模型(LLM)最佳学习路线、代码、论文,全汇总!产品经理、程序员、转行必看!

AI趋势势不可挡,风口来了!无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套资料涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。

2024-06-27 14:59:12 787

原创 大模型入门好书推荐 - 《大规模语言模型:从理论到实践》附PDF版

预训练阶段:介绍了如何利用包含数千亿甚至数万亿单词的训练数据,并借助超级计算机进行深度神经网络参数的训练。同时,探讨了如何构建训练数据以及高效地进行分布式训练。有监督微调阶段:讲解了如何利用少量高质量的数据集,通过提示学习和语境学习等方法,将语言模型转变为对话模型。这一阶段的难点在于如何构建训练数据及其内部关系。奖励建模和强化学习阶段:介绍了如何根据用户提示词,利用奖励模型评估模型补全结果的质量,并通过强化学习进一步优化模型性能。该阶段需要解决强化学习方法稳定性不高、超参数众多及模型收敛困难等问。

2025-02-05 09:53:58 816

原创 【DeepSeek Janus Pro】重磅开源!文生图+图像识别,统一多模态大模型奠基之作!帮你赚钱的几个路径

很多AI我都体验过,从chatGPT、midjourney到豆包、Kimi、即梦……多亏有了AI,才让我们在面对老板的无厘头要求时,从容应对。

2025-02-05 09:39:58 1178

原创 手把手教你在本地部署 DeepSeek R1,并集成到 Dify 中,建议收藏!

一步步指导你如何在本地环境中安装 DeepSeek R1,并将其融合进 Dify 中,确保你的工作的效率得到实质性的提升!本部分内容将重点阐述如何在本地环境下利用 Ollama 来部署 DeepSeek R1。后续章节将详细讲解如何将 DeepSeek R1 与 Dify 系统进行集成。请访问 Ollama 的官方网站,根据你的操作系统选择合适的版本,下载 Ollama应用程序并进行安装:安装完成后,打开命令行界面并输入ollama命令。

2025-02-04 11:08:21 1195

原创 大模型入门学习:一分钟了解大模型的基础概念知识

Pipeline 并行(流水线并行):将模型的不同层分布在多个设备上,形成一个处理流水线,这样每一部分只需要存储和处理模型的部分参数。张量并行:针对大规模张量操作,将其分解并在多个GPU上并行执行,例如,对于大的矩阵乘法操作,可以将矩阵沿某一维度切分后在多GPU上进行并行计算。混合并行:结合数据并行与模型并行,根据模型结构特点灵活应用。

2025-01-22 10:24:33 618

原创 先看懂这本LLM完全手册,你就算大模型入门了!

2022年底,ChatGPT 震撼上线,大语言模型技术迅速“席卷”了整个社会,人工智能技术因此迎来了一次重要进展。中国人民大学在 arXiv 网站发布了英文版大语言模型综述文章《A Survey of Large Language Models》,该综述文章系统性地梳理了大语言模型的研究进展与核心技术,讨论了大量的相关工作。同时,为了促进大模型知识在中文社区的传播,推动中文大模型研究,中国人民大学对英文版进行了翻译校对,推出了首个中文版大语言模型综述!

2024-11-28 13:46:56 200

原创 AI Agent给了企业新出路,但这条路并不好走

大模型的引入,可以增强RPA的功能,使其不仅能够理解和生成自然语言,还能自动创建内容、改进决策,甚至生成代码,从而为客户提供更多价值,提高生产力和效率。智能体之间的协作方式类似于人类的工作模式,它们能够主动分配任务,按照既定的标准流程操作,并具备自我监督的能力,以确保工作质量和效率。从AI行业角度来看,尽管AI Agent应用仍然处于早期发展阶段,但中国市场的多样性为AI Agent提供了丰富的应用场景和数据资源,国内AI企业可以充分利用这些天然优势,开发出更加符合本土市场需求的AI Agent产品。

2024-11-26 09:53:47 741

原创 人人都在学的智能体(AI Agent),老司机带你轻松入门

我们来看看最早技术上的定义。

2024-11-25 17:57:51 988

原创 14 天速成 LLM 高手!免费分享大佬开源笔记,GitHub 狂揽 700 星

学习路线中的主要知识点包含:token 嵌入、位置嵌入、自注意力、Transformer、对 Q、K、V 的直观理解、因果和多头注意力、温度、top - k、top - p、分类和指令微调、旋转位置编码(RoPE)、KV 缓存、无限注意力(长上下文窗口)、专家混合(MoE)、分组查询注意力(grouped query attention)、llama - 2 架构及相关技术等。幻觉是指模型生成的文本与现实世界的事实或用户输入不一致的现象,对于研究人员和使用 LLM 构建应用的人来说,都是一个巨大的挑战。

2024-11-19 11:21:57 506

原创 AI新时代序幕!大模型研究报告(附AI名词详解)

但是现在,有了AI大模型,我们可以通过模型微调的手段,基于超大规模基模型,打造出领域大模型或者行业大模型,进而覆盖更多行业自场景。而且,AI大模型不仅能生成代码,还能补全必要的代码块,保证一定的准确率。比如说,ChatGPT就是一个基于AI大模型研发的人工智能聊天机器人,它能够理解我们的语言,回答我们的问题,甚至还能进行对话和写作。比如说,GPT系列模型在自然语言处理领域的多个任务中都取得了非常好的表现,而BloombergGPT则是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务。

2024-11-19 10:48:26 1296

原创 2024年中国AI大模型场景探索及产业应用调研报告:大模型“引爆”行业新一轮变革

投资机会包括算力芯片、细分产品、细分市场和应用领域,风险包括基础算力不足、人才缺乏、数据获取成本高和法规风险。技术趋势包括预测大模型、决策大模型和具身智能大模型,竞争趋势表现为资源聚焦单一发展路径。企业主要通过深化通用大模型能力或打造垂类行业大模型提供服务,商业模式灵活多元化。报告预测,到2028年中国AI大模型行业的市场规模将突破千亿元,行业前景巨大。AI大模型提升各行业生产要素的产出效率,提高数据要素在生产要素组合中的地位。金融、电商、教育和医疗领域是未来五年AI大模型应用潜力最高的四大下游行业。

2024-11-19 09:43:08 292

原创 阿里内部消息:互联网巨头豪赌AI Agent,背后秘密大曝光!

阿里千问的 P10 的一位老哥交流,提到接下来开发者必须掌握的技能,他斩钉截铁的说“要懂大模型,更要懂 AI Agent”。,我能正在经历一场重大技术变革,还不像当年的互联网的兴起,这是一场颠覆性的变革,掉队就等于淘汰,因为未来所有应用都将被AI Agent重写一遍;,先入场的同学至少会享受4~5年的红利,拿高薪,并且会掌握更多的资源。

2024-11-18 11:23:21 501

原创 五大主流开源大模型RAG评估框架详解

AI Agent 足够重要,但也足够复杂,我这两年的实践的结论是,想开发出一个能够可靠稳定的 Agent 应用实在太难了,大模型技术本身的复杂度,大模型推理的不确定性等等,这些困难直接导致很人对其望而却步,或是遇到问题无从下手。最近两年一直在研究大模型应用技术,大模型的价值太大了,AI Agent 的潜力太大了,“未来所有应用都将被 AI Agent 重写一遍”这句话也是今天听到最多的一句话。利用这些功能,用户能够对不同 LLM 大模型的输出进行详细比较,识别各自的优势与不足,进而挑选出最合适的大模型。

2024-11-18 11:10:10 1466

原创 别再手动编排工作流了,AI做的比你更好!

这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。让我们将 AFLOW 的优化过程比作探索一道新佳肴的旅程,就像精心调配食材一样,AFLOW 也在逐步调整工作流程,直至呈现出最令人满意的结果。AFLOW 的目标是在特定任务中,寻找表现最佳的工作流程,这些任务可能包括解决数学问题、根据需求编写代码,或是进行长文本的多步骤推理。短期内,答案是否定的。随着时间的推移,AFLOW 的烹饪日记越来越丰富,它的“厨艺”也日益精进。

2024-11-18 11:04:57 930

原创 AI绘画美女指令大全,5个技巧让你的画作惊艳四座,美得令人窒息

你是不是曾梦想过自己也能创作出如画美景般的美女形象,却苦于手边的画笔无法达成心中所愿?在这个科技飞速发展的时代,AI绘画技术已经悄然走进了我们的生活,让每一个普通人都能成为艺术大师。你可能会问,AI绘画真的能做到如此惊艳的效果吗?今天,我们就一起来揭示这背后的秘密,分享5个技巧,让你的画作美得令人窒息。

2024-09-26 11:51:40 956

原创 Midjourney高清指令:3个技巧让你的AI绘画更清晰细腻,惊艳众人

别担心,今天我就带你一起探究如何利用Midjourney的高清指令,让你的AI绘画作品更加惊艳,吸引所有人的目光。别停留在理论上,赶紧打开Midjourney,亲自试验一下这些指令,看看你能创造出怎样的惊艳作品!原因很简单,分辨率越高,细节表现越丰富,绘画效果自然更加细腻。Midjourney提供了一些高级指令可以帮助你调整纹理和细节,让你的作品更加精美。Midjourney提供了丰富的调色选项和光照效果,可以让你的作品更加生动。通过设置特定的调色板,你可以控制画作的整体色调,让作品看起来更协调。

2024-09-26 11:39:58 1326

原创 AI绘画:Stable Diffusion 终极炼丹宝典:从入门到精通

现阶段,AIGC(人工智能生成内容)领域主要有两大热门趋势,Stable Diffusion因其开源免费的特性和高度灵活的定制性而备受青睐,尤其吸引那些热衷于探索和创新的人群。在互联网大厂中,AIGC 已经展现出强大的应用潜力。无论是内容创作、智能客服,还是数据分析、代码生成,AIGC 都大显身手。此外,众多科技企业也在积极孵化 AIGC 项目,互联网巨头纷纷推出相关岗位,不论是技术还是产品、运营、设计,争相占领这一技术高地。(boss直聘AIGC相关高薪岗位)在AI绘图领域,

2024-09-13 10:39:24 738

原创 一文看懂开源许可证:大语言模型和向量数据库入门指南

开源许可证是 AI 中协作开发和创新的基石,定义了开源软件访问、使用和分发的边界。ASF 主要以开发广泛使用的软件项目如 Apache Hadoop 和 Apache Kafka 而闻名,它提供了一个开放和去中心化发展的框架,并采用宽松的许可模型。社区参与有助于维护开源生态系统内的互信、透明度和共识,促进创新和增长,同时保持开源软件的完整性。假设一家提供开源软件的公司突然关闭源代码或使用具有更多限制的许可证,那么利用最后一个开源版本代码的企业就不得不承担维护代码和开发新功能的重担。

2024-08-02 17:51:09 622

原创 大模型应用落地:如何选择合适的 Embedding 模型?

OpenAI 的创新工具 Sora,则在文本到视频的生成领域展现了非凡能力,与 Dall-E 在图像生成领域的成就相似,Sora 仅需用户输入文本提示,即可借助强大的 LLM 生成对应的视频内容。该模型不仅在排名上表现抢眼,而且以其较小的体积适合在有限资源的设备上运行,此外,模型卡片提供的博客和论文链接也增加了其透明度和可信度。至于多模态文本-视频的 RAG 应用,则采取了类似的策略,先将复杂的视频内容简化为可处理的文本描述,经 Embedding 转化后执行文本查询,最后输出相关的视频片段作为检索成果。

2024-08-02 17:49:21 865

原创 RAG 的尽头是 Agent?

Naive RAG(基于检索的增强生成)应用主要是在整合自身知识库的基础上,提升大型模型的性能,以产出更精准、即时和丰富的行业内容或定制化信息。信息转换:{“英文关键词”: [“bicycles”, “invention”, “timing”], “中文关键词”: [“自行车”, “发明”, “时间”]}。用户输入示例:“请用2000字的篇幅详细说明,我的问题是,自行车是什么时候发明的?因此,我们的大模型应用也将从 RAG 迈向 Agent,可以说,Agent 是 RAG 发展的必然归宿。

2024-08-02 17:42:32 900

原创 RAG 开发四大痛点及解决方案

收录了52个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。在最初的 RAG 方法中,比较类型的问题表现尤为不佳。观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

2024-07-31 10:09:16 768

原创 基于LLM的搜索排序

滑动窗口重排序次数的影响:表中的方法(3)(4)显示进行多次重排序可能会提高nDCG@10,但会损害nDCG@1排序性能(例如,nDCG@1下降了3.88)。滑动窗口的方案简单,不过笔者认为从全局来看,该方案不太公平,因为不同段落之间的排序未必存在偏序传递关系:图中p4和p5未必比p6和p7更优。对第二个问题,文章采用蒸馏技术,以在更小的专用排序模型中模仿ChatGPT的段落排序能力。文章的方案是最后一个,将一组段落输入到LLM,每个段落都有一个唯一的标识符(例如,[1],[2],等)。

2024-07-30 11:26:43 811

原创 解锁LLM应用潜能:提示工程的39种方法与应用全解析!

大型语言模型(LLMs)在许多不同的自然语言处理(NLP)任务上表现出了显著的性能。提示工程在提升LLMs已有能力方面发挥着关键作用,使其在各种NLP任务上取得了显著的性能提升。提示工程需要编写自然语言指令,即提示,以结构化的方式从LLMs中提取知识。与以往的最先进(SoTA)模型不同,提示工程不需要根据给定的NLP任务进行广泛的参数重新训练或微调,而是仅依赖于LLMs的内嵌知识。此外,LLMs的爱好者可以通过基本的自然语言对话交换或提示工程,智能地提取LLMs的知识,使得越来越多的人即使没有深厚的数学机器

2024-07-30 11:23:34 789

原创 什么是机器学习

而有了机器学习,你只需要给电脑大量的猫和狗的图片,告诉它哪些是猫,哪些是狗,然后它自己就能“学习”到这些特征,下次再给它一张新图片,它就能猜出来这是猫还是狗了。最近几年,人工智能领域的“大模型”火得一塌糊涂,比如OpenAI的GPT-4,百度的文心一言、阿里的通义千问等,这些模型拥有超强的学习和推理能力,能生成自然语言、回答问题、作诗写歌、生成创意图片。强化学习就像是你在玩一个复杂的网络游戏,没有别人来教你具体该怎么做,但是每次你做出一个操作,游戏都会给你反馈:要么得分(奖励),要么扣分(惩罚)。

2024-07-30 10:58:10 389

原创 赶超 GPT-4o,最强大模型 Llama 3.1 405B 一夜封神,扎克伯格:开源引领新时代

为了实现这种规模的训练并在短时间内达到预期的效果,研究团队优化了整个训练堆栈,在超过 16000 个 H100 GPU 上进行训练,这也是第一个在如此大规模上训练的 Llama 模型。通过监督微调、拒绝采样和直接偏好优化等方法,在预训练模型基础上进行多轮对齐,构建聊天模型,Llama 3.1 405B 也能够更精确地适应特定的使用场景和用户需求,提高实际应用的表现。简单来说,超大杯 Llama 3.1 405B 是 Meta 迄今为止最强大的模型,也是全球目前最强大的开源大模型,更是全球最强的大模型。

2024-07-29 11:16:36 823

原创 AI+技术 | 一文读懂以LLM为核心的AI Agent的架构指南

控制端处于核心地位,大脑模块承担记忆、思考以及决策制定等基础工作,感知模块则负责接受和处理来自外部环境的多样化信息,如声音、文字、图像、位置等,最后,行动模块通过生成文本、API调用、使用工具等方式来执行任务以及改变环境。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

2024-07-29 10:49:44 1013

原创 AI应用 | 【AI+工业】LLM(大型语言模型)在工业领域中的十个应用

同样在 6 月,Cognite 推出了 Copilot 产品,利用 LLM 的自然交流能力,将其作为通用的低代码接口,连接到其解决方案的最先进功能,从而为更多的一线工人、数据科学家、设施管理人员和高管提供了通过他们喜欢的媒介与关键信息进行交互的能力。虽然即使是当今最强大的 LLM(如 GPT-4 和 Claude)有时也会犯错,但如果利用适当的软件支架来引导他们的注意力,他们对世界的一般知识就能为操作员、经理和工程师提供快速、无需判断的理智检查,或对关键决策提供第二意见(见图4)。

2024-07-29 10:33:20 927

原创 科普贴:什么是大模型?快速了解大模型基本概念

随着技术的不断进步,大模型将在未来的智能社会中扮演更加重要的角色,为人类社会带来更多的可能性。想象一下,如果你的大脑能够记住整个图书馆的所有书籍,并且能够理解每本书的内容,那么你就拥有了类似大模型的能力。大模型是人工智能领域的一种机器学习模型,它们通过学习大量的数据,获得了类似于人类理解语言、图像和声音的能力。那么,什么是大模型呢?我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下。

2024-07-29 10:29:30 1054

原创 大模型微调实战

最后,当专家要解决新任务时,他会先参考简化版的“知识点手册”,找到与任务相关的关键知识,然后用“解码手册”把这些知识转化为具体的行动指令。首先,我们给这位专家配备两本“秘籍”:一本是简化版的“知识点手册”(对应低秩矩阵A),另一本是对应的“解码手册”(对应低秩矩阵B)。也就是说,我们在微调时,只更新这两本秘籍里的内容,而不去碰专家脑子里其他成千上万的知识点。我们使用modelscope下载的数据集模型文件都在缓存文件夹中,为了方便读取和微调,我们把它移动到ChatGLM3文件夹中。

2024-07-27 10:44:09 678

原创 从技术路径,纵观国产大模型逆袭之路

2024-07-27 10:36:47 172

原创 一文了解AI Agent

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下。AI Agent就像有了超能力的小助手,不管是帮你打扫卫生,解答疑问,还是在复杂的工厂里帮忙干活,它们都能自己做判断、做事情。

2024-07-27 10:28:43 2429

原创 从零开始学习大模型

随着技术的进步,大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及视频。了解当前主流的大模型,如GPT系列、BERT、Transformer等,学习它们的基本架构和工作原理。学习机器学习的基本概念、算法和模型,如线性回归、决策树、随机森林、支持向量机等。学习如何处理和准备数据,以适应大模型的需要,包括数据清洗、标注和增强等技术。学习模型优化技术,如模型压缩、量化、蒸馏等,以提高模型的效率和性能。

2024-07-27 10:06:20 350 1

原创 万字长文剖析城市大模型:认知、应用、展望

理想的,我们还是希望有一个政策知识库,它不是简单的一堆文本的文件夹,而是一个有知识结构的库,具备实时更新、智能检索、语义理解等功能。它通过自主学习,掌握了挖掘、建房屋、收集、打猎这些基本的生存技能,还通过自我驱动,不断探索着这个神奇的世界,去到不同的城市,路过一片片海洋,一座座金字塔,它甚至还会自己搭建传送门。广义的城市大模型的落地实施,需要行业主管部门进行顶层设计和统筹规划,以确保行业共性知识库的合规性,并推动建立一个可扩展、可协同的行业大模型技术架构,同时,探索可持续的运营与服务模式。

2024-07-27 09:59:57 1091

原创 2024年AI前20岗位薪酬出炉!搞AI大模型的远超同行?

AI相关,细分技术领域,薪资前20岗位,都有哪些。今天这篇文章与铁铁们分享一下。

2024-07-25 15:01:30 4393

原创 最强大模型 Llama 3.1-405B 架构设计剖析

接着,利用人工标注数据通过 DPO 模型调整LLM参数,DPO 实质上是一个二分类任务,它从<Prompt,Good Answer,Bad Answer>的三元数据中学习,调整模型参数以促使模型输出 Good Answer,避免输出 Bad Answer。这样就完成了一个后训练迭代周期。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

2024-07-25 12:21:17 2474

原创 大模型“算”出青岛未来

2024年5月底,在青岛市算力发展大会上,青岛市工业和信息化局发布的《青岛市人工智能产业创新发展行动计划(2024—2026)》提出:青岛将实施算力设施“强基”、算法模型“铸魂”、数据要素“提质”、核心产业“固链”、创新平台“领航”、产业生态“聚力”、场景应用“赋能”七大行动,将大模型作为重点推进方向。”张文政将海尔、海信、青啤这些企业比作圆心,在它们的“圈子”里有数以万计的攸关方,而“圆心”们打造的大模型产品几乎具备一呼百应的能力,谁与之相关,谁就能获得精准的大模型赋能。

2024-07-25 12:10:40 777

原创 中小企业,AI大模型喊你“快上车”,定制企业专属‘模型’

最近在国内的8个矿井发生了同一件新鲜事——煤矿工人不用下井,而是在地面上作业,不仅工作环境更舒适,而且极大地减少了安全事故。覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,减轻煤矿工人的工作强度,华为云盘古矿山大模型游刃有余。在银行,排队办理业务的人为什么少了?因为华为云盘古金融大模型可以对银行的各种操作、政策、案例文档进行预训练,根据客户的问题,为柜台工作人员自动生成流程和操作指导,所以将原来需要平均5次的操作缩减至1次,办结时间缩短5分钟以上。

2024-07-25 12:02:40 1031

原创 一文让你搞懂什么是AI大模型!

通用大模型技术快速发展,但很多传统行业推进得并不快。对企业而言,大模型应用需要综合考虑专业性、数据安全、持续迭代和综合成本等多种因素。针对这些现实情况,腾讯集团提出重点发展行业大模型的理念。本文基于一线大量实践反馈,做出系统归纳总结,呈现行业大模型发展真实情况,厘清关键争议和困惑问题。真正解决用户需求、距离场景和数据更近的企业,将拥有大模型的未来。

2024-07-23 17:43:29 1230

原创 如何快速构建个人 AI 知识库?

相反,如果资料是完整的文章,具有较强的连贯逻辑,则应尽量增大切块尺寸,以避免将一个连贯的段落切割得支离破碎,影响上下文的连贯性。更强大的是,一条笔记可以链接到另一条笔记,形成知识图谱的关联逻辑。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。正如我之前提到的,它的集成度非常高,从模型的搜索和下载,到加载和对话,所有功能都集中在一个包内。

2024-07-23 17:14:00 1083

原创 RAG 企业级应用落地框架细节差异对比

在模型微调过程中,我们采取了分步骤的策略:起初使用公开可用的通用问答数据集进行初步微调,随后利用特定领域的问答数据进行进一步微调,最终使用经过人工精确标注的高质量问答数据来进行细致的微调。作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。这三个步骤表面上看似乎并不复杂,然而在 RAG 从构建到实际部署的整个流程中,包含了众多精细且复杂的工作环节,这些落地细节是最具挑战的工作。

2024-07-23 15:24:17 876

Stable Diffusion 新手入门教程,安装使用及模型下载

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画,Stable Diffution ,Midjourney 要有一个学习规划。给大家分享一份全套的 AI绘画学习路线,安装工具,ComfyUI插件、模型文档、变现方案等资料,具体看下方,全部免费了!

2024-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除