- 博客(295)
- 收藏
- 关注
原创 大模型实战:使用 LoRA(低阶适应)微调 LLM
一些微调的最佳实践包括使用强正则化、使用较小的学习率和少量的epochs。一般来说,像卷积神经网络用于图像分类的神经网络并不完全微调,这样做很昂贵,可能导致灾难性遗忘。我们只微调最后一层或最后几层。对于LLM,我们使用一种类似的方法,称为参数高效微调(PEFT)。其中一种流行的PEFT方法是低秩适应(LoRA),LoRA 是低秩适应 (Low-Rank Adaptation) 的缩写,其是一种用于微调深度学习模型的新技术,它在模型中添加了少量可训练参数模型,而原始模型参数保持冻结。
2024-12-05 15:48:04 818
原创 使用 LLM Graph Transformer 构建知识图谱
当使用 LLM Graph Transformer 进行信息抽取时,定义一个图形模式对于引导模型构建有意义且结构化的知识表示至关重要。一个良好定义的图形模式指定了要提取的节点和关系类型,以及与每个节点和关系相关的任何属性。该模式作为一个蓝图,确保 LLM 以符合所需知识图谱结构的方式一致地提取相关信息。在这篇博文中,我们将使用 玛丽·居里维基百科页面[11] 的开头段落进行测试,并在末尾添加一条关于罗宾·威廉姆斯的句子。我们在所有示例中还将使用 GPT-4o。
2024-12-05 15:45:29 681
原创 Qwen2大模型微调入门实战
Qwen2是通义千问团队最近开源的大语言模型,由阿里云通义实验室研发。以Qwen2作为基座大模型,通过指令微调的方式做高精度文本分类,是学习LLM微调的入门任务。在本文中,我们会使用 Qwen2-1.5b-Instruct 模型在 复旦中文新闻 数据集上做指令微调训练,同时使用SwanLab监控训练过程、评估模型效果。采用了Lora方法,所以显存要求不高,10GB左右就可以跑。代码:完整代码直接看本文第5节 或 Github,Jupyter Notebook。
2024-12-05 15:37:30 635
原创 看AI如何大海捞针,探索LLM能力边界实战
长上下文语言模型的发展为我们带来了巨大的潜力。为了有效地利用这些模型,无论是独立使用还是作为外部检索系统的替代,了解它们的能力和局限性至关重要。"多针检索加推理"基准测试为我们提供了一个评估长上下文检索性能的有用工具,特别是在与传统的检索增强生成(RAG)方法相比较时。检索并非万无一失- 并不能保证所有事实都能被检索到,尤其是当涉及的事实数量和上下文规模增加时。检索失败的模式各异- 随着上下文长度的增加,GPT-4 在检索位于文档开头的事实时表现不佳。提问方式至关重要。
2024-12-05 15:34:00 855
原创 LLM大模型技术实战:大白话带你入门机器学习
线性回归:对数值型连续随机变量进行预测和建模的监督学习算法(即最后输出的特征向量的标签是连续值),即找拟合函数特点:简单、易于理解和实现,基于线性假设建立输入和输出之间的关系。应用场景:预测房价、股票价格、温度等连续值问题。优点:计算效率高,模型可解释性强。缺点:假设数据符合线性关系,对于非线性问题需要转换或采用其他方法。支持向量机 (SVM):目标在于在空间中寻找一个超平面,使得数据集可以被超平面分开,从而完成分类任务特点:能够处理线性和非线性问题,通过核技巧可以解决非线性分类问题。
2024-12-05 15:31:17 697
原创 学习AI大模型的3件事你必须知道,业内知识,速看
准备学习AI的伙伴!以下3点知识,你必须知道!尤其第3个,对你未来的职业影响非常大!你是否遇过这种情况?想搜索一个问题,搜索出来的答案乱七八糟?特别是防不胜防的广告!严重干扰了我们的判断?有了AI之后,你只需要输入想要搜索的问题,比如搜索“小米苏7是否值得买?他的配置如何?”这样一个问题。AI就能帮你进行全网分析,总结答案!这是不是比传统的搜索方式更加高效方便,同时还避免了广告的干扰!直击想要的答案!
2024-12-04 15:39:06 917
原创 求教0基础入门大模型的学习路线?java出身,数学良好,希望入局大模型算法,有无必要从cnn学起?
本人本科学历java开发出身,数学基础良好,希望入局大模型算法,有无必要从cnn学起?transformer、bert是否必须要学?希望能在最短的时间掌握相关知识…近年来,随着大模型的火爆,他的领域几乎涉及到了生活中的方方面面:那么如何快速从0到1入门大模型呢?往下看;基础入门大模型,transformer、bert这些是要学的,但是。
2024-12-04 15:34:52 1289
原创 大模型(LLMs)学习笔记——基础知识
(1)Causal Decoder(因果解码器)介绍:从左到右的单项注意力代表模型:Chat GPT、LLaMA-7B、LLaMa系列。(2)Prefix Decoder(前缀解码器)介绍:输入双向注意力,输出单向注意力代表模型:ChatGLM、Chat GLM2、U-PaLM介绍:输入双向注意力,输出单向注意力代表模型:T5、BERT、Flan-T5。
2024-12-04 15:31:00 1048
原创 企业实施AI大模型落地项目指南
2024年8月6日,麻省理工学院计算机科学与人工智能实验室主任Daniela Rus全新力作正式发布!进入下半年,经过持续了1年多的“AI狂热”之后,理性的企业开始全面着手探索AI的能力边界,这本书通过AI七大能力的核心展示,深入探讨了底层技术及其局限性和可能性。与此同时,本书还专门展示了。当下正在上演的AI革命,与二十年前的数字化变革同样重要。原生AI企业将享有类似于原生数字企业的优势——它们能更快拥抱和部署新技术,从而尽早尝到甜头。而其他企业呢?员工、基建、战略,统统要升级换代。
2024-12-03 16:34:12 667
原创 企业落地大模型的“五步法”
如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!😝有需要的小伙伴,可以保存图片到。
2024-12-03 16:30:03 802
原创 53个工业大模型全面梳理
如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!😝有需要的小伙伴,可以保存图片到。
2024-12-02 17:39:11 554
原创 企业构建AI大模型应用的步骤流程与关键问题解析
构建企业级AI大模型驱动的应用系统是一项跨越技术与业务边界的综合性任务,它不仅考验着企业在业务领域知识的深度,也挑战着企业基于AI大模型构建应用的技术高度。这一过程要求业务专家与AI大模型专家紧密协作,共同确保通过AI大模型的赋能,实现业务价值的倍增效应。基于实践经验总结,可以系统化地将AI大模型应用的构建流程划分为五个核心步骤:1)需求场景的精确定义、2)大模型的科学选型、3)大模型性能效果的强化调优、4)大模型的部署与运行维护,以及5)AI应用的无缝集成。
2024-12-02 17:36:07 1058
原创 大模型落地场景众多,为什么建议企业优先落地知识库?
大模型技术落地时,分了四层:应用层、中间层、模型层、基础层。过去大家是把知识库当成核心落地的一个场景,尤其今年爱分析和企业用户交流的过程中,企业用户基于上层的场景,抽象出一些中间的能力,放在中间层。过去的中间层主要是一些大模型的运维工具,现在有越来越多的企业用户会考虑把中间层作为一个能力中台,去调用各种各样能力。在这些能力当中,核心看到三个能力落地比较多。第一个是知识库及知识库的 RAG 检索,是企业用户在落地的过程中,优先考虑以及选择比较多的能力场景。
2024-11-30 15:24:51 891
原创 企业如何将AI大模型作为新质生产力进行落地应用
AI大模型凭借其卓越的推理能力和自适应性,正在为企业搭建通往智能未来的桥梁。如何将其成功应用于企业实际业务中,并将潜在效能转化为现实成果,是企业领导者亟需解决的问题。本文将从技术能力、应用实例、安全策略、组织架构调整和落地实施路径等方面,深入剖析这一课题。AI大模型作为人工智能领域的创新产物,其发挥作用的核心在于其强大的推理能力和学习能力。:AI大模型能够通过复杂的算法结构,对海量数据进行深度分析与推理。这种能力使其在处理多元化业务场景时,能够快速做出智能的判断和决策。
2024-11-30 15:22:30 1252
原创 企业落地大模型的路径选择:微调、RAG、提示词工程
与传统应用不同,模型的输出是不确定的,即使多次问它一样的问题,给出的结果也可能不一样。这种特性对于日常应用业务 OK,但是如果要在企业内用来处理具体业务问题,就必须提高这个稳定性,否则影响生产经营,例如产线操作人员通过模型获取操作步骤或者参数,如果步骤或者数据不对可能会导致产品出现质量问题等等。模型一旦训练好,就无法再补充数据,因此模型不会了解你自己组织内部的年假规定,注意事项。如何让大模型掌握这些数据是另外一个需要解决的问题。
2024-11-30 15:15:25 704
原创 重磅!北京发布首批10个行业大模型应用案例
6月27日,北京市科委、中关村管委会举办北京市人工智能策源地引领推介活动的首期活动,发布了北京市首批人工智能行业大模型应用案例。在发布会上,百度、智谱华章、中国科学院自动化研究所等10家技术供给方介绍了应用案例情况,北京市政务局等行业用户代表场景供给方介绍了面向人工智能企业开放大模型应用场景的考虑。北京市科委、中关村管委会二级巡视员刘航表示,大模型赋能行业应用正在蓬勃兴起,场景驱动成为大模型技术创新的重要模式,有望形成新的产业业态和经济增长点。
2024-11-30 15:13:12 949
原创 2024最新最全【大模型学习路线规划】零基础入门到精通!
目标:了解大模型的基本概念和背景。内容:人工智能演进与大模型兴起。大模型定义及通用人工智能定义。GPT模型的发展历程。目标:深入学习大模型的关键技术和工作原理。内容:算法的创新、计算能力的提升。数据的可用性与规模性、软件与工具的进步。生成式模型与大语言模型。Transformer架构解析。预训练、SFT、RLHF。目标:掌握大模型开发所需的编程基础和工具。内容:Python编程基础。Python常用库和工具。提示工程基础。目标:通过实战项目深化理论知识和提升应用能力。
2024-11-29 22:09:24 614
原创 一文讲明白初学者怎么入门大语言模型(LLM)?
关于如何入门LLM,大多数回答都提到了调用API、训练微调和应用。但是大模型更新迭代太快,这个月发布的大模型打榜成功,仅仅过了一个月就被其他模型超越。训练微调也已经不是难事,有大量开源的微调框架(llamafactory、firefly等),你只要懂部署,配置几个参数就能启动训练。甚至现在有大量云上项目,你根本不需要部署,直接上传数据,就能启动。这我让想起来之前的算法工程师都被调侃成调参师,新出一个大模型,下载下来跑一遍,运行一遍,对于自己理解和入门大模型没有任何意义。
2024-11-29 22:04:13 651
原创 大模型在金融行业的应用场景和落地路径
这是最好的时代,也是最坏的时代。尽管大模型技术在金融领域具有巨大的应用潜力,但其应用也面临不容忽视的风险和挑战。本文将深入研究大模型在金融领域的数据隐私和安全风险、模型可解释性和透明度、监管和合 规要求,梳理中国、美国、欧洲等地 AIGC 技术的应用规则,探索对应的风险管理和应对策略。当前,金融科技已经从“立柱架梁”迈入了“积厚成势”新阶段,越来越多的金融机构积极使用数字技术来为金融血脉注入全新能量。
2024-11-27 17:20:26 739
原创 复旦张奇教授团队开源免费书《大规模语言模型:理论与实践》
最近看到复旦大学张奇教授团队新公开了免费的大语言模型书《大规模语言模型:理论与实践》,虽然我只看了一部分,但感觉质量挺高的,而且是全公开免费的,今天分享给大家。看张奇教授的主页,感觉这教授、博导太牛了。这里是主页的地址:因为本书是教材,所以连课件都做好了。课件的章节,也是本书的目录。这本书是专攻大模型的,写了大模型结构、训练和评估的全流程。可以说质量真的挺高的,下面我截取一下部分目录和章节,大家可以管中窥豹。如果你是零基础小白,想快速入门大模型是可以考虑的。
2024-11-27 17:17:17 995
原创 人大出版了最适合中国人的大模型入门中文教程手册!!!
大家还记得这篇在2023年3月发表的关于大语言模型的综述文章吗?当时一发表就在全网受到了很好的反响,毕竟这篇文章从发表到现在才一年就已经更新到了第13个版本,包含了83页的正文内容,并且收录了900多篇参考文献,非常系统全面!但就在前不久,中国人民大学又对这篇综述的内容进行了大幅度的更新与重组后,正式发表了大语言模型的中文版入门书。这本书在2023年12月就已经开始进行编写,它与英文综述的定位不同。
2024-11-27 17:13:28 1198
原创 RAG,在企业AI中释放LLM大模型的潜力
OpenAI ChatGPT、Google Gemini等AI应用的背后均由LLM驱动。LLM可以理解、总结、生成和预测新内容。但是,这些大模型生成的内容仍然可能不一致,并在一些知识密集型任务中败北,尤其是那些超出其初始训练数据的任务,或者需要最新信息的任务。这种情况下,LLM可能会返回虚假信息,也称为AI幻觉。LLM通常是离线训练的,这使得模型不理解后来的任何数据。另外当LLM的训练数据不足时,也可能影响响应的质量。为解决这些问题,人们提出了RAG技术。
2024-11-26 17:33:18 944
原创 ChatGPT 太贵?一键部署自己的私有大模型
部署你的私有化对话机器人,只需要三步:克隆 github 中文版 LLaMa repo下载 HuggingFace 13B 16K 完整模型启动对话窗口没错,就是这么简单我把这份操作指南,做成了一份 Jupyter Notebook 分享给大家,以下是链接:这份笔记,支持中文 LLaMa 2 ,采用 13B-16K 的大模型,上下文可以达到 16K Token它可以做哪些事情呢?第一,声讨日本:第二,擅长写校园爱情小说你可以把它当 ChatGPT 的平替,大家发挥脑洞吧。
2024-11-26 17:30:17 1002
原创 人工智能大模型的发展与对比:从起步到全球竞争
近年来,人工智能大模型(AI Large Models)引发了全球范围内的技术革命。无论是在自然语言处理、生成式AI,还是在图像生成和代码辅助开发方面,大模型都展现了强大的能力。本文将简要介绍大模型的发展历程,并对比目前市场上中美两国流行的大模型,揭示它们的技术特点与应用场景。大模型的崛起可以追溯到2017年Google提出的。这种基于注意力机制的模型突破了传统RNN和CNN的局限性,为大规模数据训练提供了可能。
2024-11-26 17:08:19 1259
原创 企业AI大模型私有化部署解决方案
是一个功能强大、架构灵活的行业应用解决方案,能够高效地将AI大模型部署到企业私有环境,包括私有云部署和本地部署,其重要优势包括:先进的应用架构和模型算法,卓越的性能,高质量的模型训练能力,全面的客户支持服务,稳定高效的技术运行和完善的运营保障体系等。在解决方案上,建议企业建立专门的AI服务器集群,配置高性能计算资源,实现大规模模型训练和推理任务。为了实施严格的数据安全,需要提供安全隔离和访问控制的措施,以防止数据泄露或非法获取。
2024-11-25 17:16:19 752
原创 API调用大模型如此方便,为何企业还要私有化部署大模型?
直接通过网页API调用大模型确实方便快捷,尤其对于那些追求效率、希望快速集成AI功能的项目来说,云端服务是个不错的选择。但为啥有些企业和个人还琢磨着要把这些大模型搬到自家服务器上,搞个本地部署呢?
2024-11-25 17:14:54 778
原创 AI+教育:大模型引领全场景智能化革新(附股)
AI技术变革传统教育,AI+教育市场未来可期。-随着AI技术逐步演进,AI+教育成为国际趋势,国内相关政策逐步落地。进入大模型时代,海外企业接入GPT实现产品能力提升,国内企业自研AI大模型,未来商业化进程有望加速。-我们认为,我国AI+教育需求空间巨大,K12教育或将成为AI主要落地领域。一方面,国家教育财政支出稳定增长,我们测算国内教育信息化市场规模已超4000亿元,未来相关经费将更多用于提升教育智能化水平和质量;另一方面,随着居民人均可支配收入增长,居民教育投入意愿逐步增强。
2024-11-25 17:04:46 1279
原创 大模型正逐步成为能源行业的关键推动力
当前,新能源头部企业对于 “智能化”与“AI技术”的定位,早已不再是整齐划一的机械臂和简单存储的云平台了。
2024-11-25 17:01:59 1073
原创 50+个AI大模型在不同领域的应用案例
👉目录1 前言2 AIGC应用案例3 ChatBot应用案例4 Copilot应用案例5 Insight应用案例6 Agent应用案例7 ToB行业应用案例8 开源人工智能应用案例1.前言随着大模型的横空出世,AI大模型在不同领域有着广泛的应用,包括内容生成、聊天机器人、智能助手等方向。这些大模型在ToB、ToG、ToC等不同客户维度下都有着各自的应用场景和挑战。微调是AI大模型发展的关键,商业模式上也出现了行业化应用与模型即服务(MaaS)的趋势。
2024-11-23 11:04:59 800
原创 人工智能将如何重塑金融行业 专家热议“AI+金融”
在全球化数字化浪潮的引领下,金融行业正站在由人工智能(AI)技术领衔的科技革命潮头。这场革命以其深远的影响力,重塑着金融服务的每一个环节。2023年底召开的中央金融工作会议上,“数字金融”被提升至国家战略层面,成为金融“五篇大文章”重要内容,这不仅昭示着金融行业数字化转型的全面加速和深化,更标志着金融与科技融合的新纪元已经到来。10月19日,2024北京金融街论坛上,一场围绕“AI+金融赋能数字金融新篇章”的主题交流就此展开。
2024-11-23 11:02:06 945
原创 AI产品还在卷,观众已经看麻了
如果用一个词来形容这一年多时间国产AI的发展,“着急”当仁不让。在几个月前,AI圈的新闻一茬接一茬。从一天到晚到处跑分刷榜,到开始天天瞄准DAU、MAU,生怕谁先做出了第一个超级应用。在国内大厂相继跑出了自己的头部AI应用后,从产品端来看,这两个月关于国产AI原生应用的新闻热度下降了一些。但才闲下来没多久,这几天,国内AI圈的新闻又热闹了起来。随着AI应用端概念回暖,市场对AI应用场景的讨论又起来了。前几天,蜜雪冰城两家子公司联合投资成立一家新公司——
2024-11-23 11:00:19 607
原创 AI营销,让科技巨头尝到了大模型商业化的甜头
在线广告收入正在成为大模型走向“钱景”最迅速的一条路。随着新一波AI浪潮的到来,不少细分领域也催生了巨大的投资机遇。比如,AI营销领域跑出了年内最强科技股。截至11月20日收盘,美股“AI应用大牛股”AppLovin年内累计涨幅高达716.11%,远超英伟达同期涨幅。原因是该公司提到,AI的助力让AXON 广告引擎不断改进,使其成为推动业务增长的重要催化剂。对此,信达证券研报称,营销可能系AI商业变现最快的领域。AppLovin股价暴涨的背后,或侧面印证了AI营销的变现能力远超市场预期。
2024-11-23 10:53:10 667
原创 AI大模型如何在企业内落地应用?
AI+”已成为继“软件+”“互联网+”之后,最重要的新质生产力,是今后十年内技术创新和产业升级的核心驱动力。AI大模型技术将重塑千行百业,如何尽快、尽好地将应用大模型技术创造新的核心能力和新的运营服务优势,是所有企业共同面对的机遇和挑战。就是要及时跟进建设自身的AI能力,要在大模型、大数据和大算力这三大要素上,让企业具备不同层次的能力(基础能力、强化能力和创新能力)。就是通过AI大模型技术的运用,全面赋能企业业务体系、运营管理和组织治理,打造新型核心竞争力,建立产品和服务的新优势。
2024-11-21 17:44:09 1169
原创 企业AIGC大模型商业落地应用及行业案例
企业AIGC大模型商业落地应用及行业案例,AIGC如何在各行业、场景中应用企业AIGC在十三个行业和场景的前瞻应用方案AIGC+营销:从认知到复购的全链路策略支持助手AIGC+客服:前端客户沟通只是开始,线索留存和规则优化是重头戏AIGC+办公协同:目标导向,赋能创新与更进一步的自动化AIGC+信息安全:精准防御,高效响应AIGC+产品/交互设计:产品上线全面加速AIGC+基础作业环节:合格的办公室文员与助手AIGC+出海服务:语言与市场差异带来的阻碍大大降低。
2024-11-21 17:40:58 1165
原创 金融行业大模型主流应用可落地场景(同行交流共识)
在当前金融行业中,大模型的应用尚处于探索阶段。由于金融行业的业务复杂性和监管要求的严苛,大模型被广泛应用于减少人工复杂工作流程和繁重的数据处理,提升效率和决策质量。基于不同专家的业务理解和实际应用经验,以下总结了大模型在金融行业中的主要应用场景:(1)风险评估大模型通过分析大量历史数据,能够识别和评估各种风险,如信用风险和市场风险。它可以评估客户的信用情况,帮助金融机构制定更精确的信贷决策,并为金融机构提供更全面的风险管理工具。(2)市场预测。
2024-11-21 17:29:26 891
原创 2024年国内8个常用AI大模型的适用性比较
日前,人民网财经研究院发布《开启智能新时代:2024年中国AI大模型产业发展报告》,对当下国内市场占有率较高的8个AI大模型从功能和适用性等方面进行了分析、对比。在知识学习与内容创作方面它可以进行要素抽取、问题生成,帮助知识学习和内容创作领域产生更丰富更有用的智能体,结合外部知识进行合理拓展。适用性分析用户可使用体验文档一键生成、AI撰写助手、多语种文档生成、AI 自动配图、多种模板选择、演讲备注等功能。通过提问获取生活常识、医学知识、政策解读等内容。
2024-11-20 17:20:58 1314
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人