- 博客(1758)
- 收藏
- 关注
原创 2022年度编程语言排行榜来啦,它凭什么能超过C语言,排名第一?
IEEE Spectrum 发布了 2021 年度编程语言排行榜,其中 Python 在总榜单以及其他几个分榜单中依然牢牢占据第一名的位置。另外值得关注的是微软 C# 语言,它的排行从 2020 年的第 23 名跃升至了今年的第 6 名,称得上是今年的大势语言。2021 年度编程语言排行榜依然从 8 个信息源按照 11 种指标收集数据,最终得到了数十种编程语言流行度的整体排名。这 8 个信息源分别为 CareerBuilder、GitHub、Google、Hacker News、IEEE、Reddit、S
2022-01-19 09:53:15 55219 4
原创 作为普通产品经理,转AI产品经理,需要做哪些准备?
我认为的Ai产品经理,其实它是在通用产品经理的基础上,增加了一个显著能力,就是如何运用现有的AI技术去帮助客户解决问题,并在原有工作效率,或用户体验上起到增强的效果。
2024-09-20 16:11:33 866
原创 搞懂9个问题,转型AI产品经理不迷茫
作者简介:王泽楷,亚太人工智能学会资深数字孪生研究专家,曾任平安科技、商汤科技任AI高级产品专家。近10年来一直工作于AI领域技术和产品一线,曾参与多个世界500强企业的AI建设项目、多个一线城市的城市级AI应用落地,在AI技术、产品的项目应用等方面积累了丰富的经验。曾从事深度学习算法研究工作,发表AI相关专利论文6篇。今天分享9个大家普遍关注却少有人系统回答的问题。从四方面看:(1)技术角度:逐步成熟且仍有大量创新;(2)价值角度:从带动生产效率、效益提升角度有巨大潜在价值;
2024-09-20 16:07:19 863
原创 真心劝大家转行AI产品经理,这么赚钱,年薪90W!!
核心是1分钟的时间简单讲清楚自己的项目经历、教育经历、工作经历、实习经历与求职岗位的匹配度即可。
2024-09-20 15:56:39 565
原创 金融领域大语言模型应用安全探析
大模型泛指能够理解、生成自然语言的大规模语言模型,借助深度学习技术,通过对大规模的文本乃至多模态数据进行预训练与微调,获得语言的理解与生成能力。GPT是目前最广为人知的大模型之一,能够处理以前难以解决的复杂语言任务,美国开放人工智能研究中心(OpenAI)于2022年推出了ChatGPT(Chat Generative Pre-trained Transformer),其一经发布就很快受到广大用户追捧,且被称为近20年来用户增长速度最快的消费者应用程序。
2024-09-17 09:00:00 923
原创 如何让大模型更好地进行场景落地?
自ChatGPT模型问世后,在全球范围内掀起了AI新浪潮。有很多企业和高校也随之开源了一些效果优异的大模型,例如:Qwen系列模型、MiniCPM序列模型、Yi系列模型、ChatGLM系列模型、Llama系列模型、Baichuan系列模型、Deepseek系列模型、Moss模型等。图片来自:A Survey of Large Language Models并且在去年的一整年中,大多数人都在做底座通用大模型的搭建、垂直领域大模型预训练或微调等工作。
2024-09-17 08:00:00 942
原创 大型语言模型微调入门指南
你可以根据特定的用例,通过微调大型语言模型的方式定制现有通用模型。为了更高效地微调模型,你可以考虑使用 LoRA 或模型分片(使用FSDP等框架)等技术。Modal的Llama和Mistral微调模板实现了许多这类的技术,能够帮助你快速启动分布式训练任务。你可以通过在 Modal 上微调 Llama 2 或Mistral 等开源模型获得一个定制的模型,这样不仅成本和延迟低于现有 API 服务,而且还非常适合自己的需求。
2024-09-17 07:00:00 1506
原创 2024!深入了解 大语言模型(LLM)微调方法
2021年微软提出的 LORA,斯坦福提出的 Prefix-Tuning,谷歌提出的 Prompt Tuning,2022年清华提出的 P-tuning v2、2023年华盛顿大学提出的QLoRA、2024年英伟达提出DoRA等基本上都是属于该范畴)。需要注意的是,与预训练一样,全微调需要足够的内存和计算预算来存储和处理训练过程中的所有梯度、优化器和其他更新组件。其中,大模型微调技术在此过程中起到了非常关键的作用,它提升了模型的生成效率和适应性,使其能够在多样化的应用场景中发挥更大的价值。
2024-09-16 09:00:00 800
原创 大语言模型机器学习框架
大语言模型是自然语言处理(NLP)领域中使用的一种技术,它们通过训练大量文本数据,从而学会理解和生成人类语言。大语言模型是自然语言处理(NLP)领域中使用的一种技术,它们通过训练大量文本数据,从而学会理解和生成人类语言。这些模型通常采用深度学习方法,其中最常用的是变形金刚(Transformer)机器学习框架。在机器学习领域,有很多种技术框架可以用来构建和训练这些大语言模型。选择哪个框架通常取决于个人偏好、项目需求以及团队的熟悉程度。每个框架都有其优点和适用场景。一、常用的机器学习框架。
2024-09-16 08:00:00 844
原创 LangChain: 大语言模型的新篇章
本文介绍了LangChain框架,它能够将大型语言模型与其他计算或知识来源相结合,从而实现功能更加强大的应用。接着,对LangChain的关键概念进行了详细说明,并基于该框架进行了一些案例尝试,旨在帮助读者更轻松地理解LangChain的工作原理。引言近期,大型语言模型(LLM)如GPT系列模型引领了人工智能领域的一场技术革命。开发者们都在利用这些LLM进行各种尝试,虽然已经产生了许多有趣的应用,但是单独使用这些LLM往往难以构建功能强大的实用应用。
2024-09-16 07:00:00 1505
原创 通俗讲解大语言模型内部运行原理Transformer
在过去几年中,大语言模型(Large Language Model, LLMs)成为了人工智能领域的关键突破之一,尤其是GPT-3和GPT-4等模型,它们被广泛应用于自然语言处理(NLP)相关的任务,如文本生成、翻译、对话系统等。这些模型之所以备受瞩目,不仅因为它们能够处理海量数据,还因为它们在理解、生成和推理语言方面表现出强大的能力。大语言模型并不是凭空出现的。其发展依赖于机器学习、深度学习以及计算资源的不断提升。
2024-09-15 09:00:00 783
原创 零基础入门大语言模型的独家教程!!!
生成式人工智能 (GenAI),尤其是 ChatGPT,吸引了所有人的注意力。基于 Transformer 的大型语言模型 (LLM) 经过大规模无标记数据训练,展现出可以推广到许多不同任务的能力。为了理解 LLM 为何如此强大,我们将在这篇文章中深入探讨它们的工作原理。LLM 进化树正式来说,仅解码器语言模型只是给定上下文的下一个标记的条件分布。这种公式是马尔可夫过程的一个例子,该过程已在许多用例中得到研究。这种简单的设置还允许我们以自回归方式逐个标记生成标记。
2024-09-15 08:00:00 575
原创 什么是大语言模型 (LLMs)
大语言模型(Large Language Models)是一种采用大量数据进行训练的人工智能模型,旨在理解和生成自然语言文本。这些模型通常基于深度学习技术,能够捕捉语言的复杂性和多样性。大语言模型在自然语言处理(NLP)领域中扮演着重要角色,广泛应用于文本生成、机器翻译、情感分析、问答系统等多种任务。
2024-09-15 07:00:00 641
原创 大语言模型独家教程
诸如ChatGPT等生成式人工智能(GenAI)已万众瞩目,基于Transformer的大型语言模型(LLMs)在大量未标记数据上进行训练,可以泛化到诸多不同类型的任务。为了更好地理解LLMs如此强大的真实原因,我们将在本博中深入探究它们的工作原理。LLM演进树形式上,一个仅有解码器的语言模型只是一个条件分布p(xi|x1···xi−1),在已知上下文为x1····xi−1 的情境下,下一个标记xi的概率。该公式假定这一过程为马尔可夫过程,已在许多用例中进行了研究。
2024-09-14 09:00:00 1095
原创 初学者怎么入门大语言模型(LLM)?
如果你真心想要入门大型语言模型(LLM),只看这一个文章应该是可以入门的。但是修行下去,还是要靠自己的了!如果你把大语言模型/LLM 当成一门技术来看,那就要看一下这门技术需要什么。基本要求:开发语言:Python , C/C++开发框架和工具库: Numpy /Pytorch /Tensorflow /Keras /Onnx数学知识:线性代数、高数、概率、凸优化这些东西我们假定你都已经会了,或者熟练使用了。如果不熟,我建议你自己再学习一下。尤其是数学的几个基本公式,是要学会的。我列一下吧。
2024-09-14 08:00:00 1952
原创 零基础如何正确学习语言大模型!!!!
大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。: 尝试使用现有的数据集或你自己的数据来训练模型。
2024-09-14 07:00:00 1633
原创 大型语言模型(LLMs)是怎样“学习”的?一封给网络工程师的大模型指南
生成式人工智能(Generative AI,一般简称为Gen AI)”是一种人工智能技术,专注于创造或生成新的内容,例如图像、文本或音乐。这些内容不是直接复制或派生自现有的示例,而是由计算机自己创造的。生成式AI的一个重要应用是生成文本,比如自动写作、诗歌创作或对话生成。“大型语言模型(Large Language Models,LLMs)”是一类生成式AI,它们通过深度学习算法在大量自然语言数据上进行训练。这些模型学习人类语言的模式和结构,并能够对各种书面输入或提示生成类似人类的回应。
2024-09-13 14:58:59 1230
原创 大语言模型如何学习和提取知识?
我们都知道,大语言模型 (LLM) 就像一个拥有海量知识的超级大脑,可以回答各种问题,例如“林肯的生日是什么时候?但它们真的是通过学习维基百科等知识库来回答这些问题吗?还是仅仅在训练过程中见过类似的问题,从而“作弊”得出答案呢?这篇文章将深入探讨大语言模型是如何和知识的。我们将使用一个精心设计的人物传记数据集,并借助探针技术来揭示模型内部的知识表示和提取机制。我们首先尝试将人物传记和问答 (QA) 数据混合在一起训练模型。
2024-09-13 14:54:29 1148
原创 如何系统性的学习大语言模型相关技术?
最近很多同学都通过微信咨询:如何系统性的学习RAG?学习模型微调是否有必要?多模态有什么学习资料没?… …遇到这些问题,并不可怕,毕竟大语言模型是一门新型学科,即使是过去做传统NLP的同学,对于大语言模型技术、及其相关应用技术也仍然比较陌生。学习大语言模型技术并不难,但是怕就怕在大家东学一下西学一下,学习的内容并非最新的内容,也没有系统性的学习。最后落了个盲人摸象。所以,学习大语言模型技术,大家有这么几个方法学习:• 研读一手学术论文,记得读最新的、找相对权威的机构发布的研究综述读一读。
2024-09-13 14:52:00 1218
原创 新手入门:大语言模型训练指南
在这个信息爆炸的时代,人工智能技术正以前所未有的速度渗透到我们生活的方方面面。从智能手机上的语音助手到自动驾驶汽车,AI的应用无处不在。而在这些令人惊叹的技术背后,大语言模型(LLM)扮演着至关重要的角色。它们不仅能够理解和生成自然语言,还能在多种场景下提供智能决策支持。然而,对于许多对AI感兴趣的新手来说,大语言模型的训练和应用似乎是一件高不可攀的事情。复杂的技术术语、晦涩的理论知识,以及高昂的硬件要求,往往让人望而却步。但其实,只要掌握正确的方法和工具,每个人都能成为AI领域的探索者和实践者。本文将带你
2024-09-09 11:03:07 1522
原创 写给“纯小白”的大语言模型入门指南
ChatGPT很牛X,上知天文,下至地理,中间还通晓人情世故。类似它的产品还有一大帮,例如:文心一言、通义千问、kimiChat…等等。而且通过我们技术工作者的不懈地努力,AI的应用已经逐渐渗入我们工作和生活的很多场景和角落,在很多工作场景下,我们都不得不感叹一句”算你NB,在下告辞!那么我们究竟是该屈服于AI大老爷的淫威之下,还是要起来反抗将其玩弄于股掌之间,这是一个选择!但是无论我们如何选择,我们都应该对其有一个深入的了解,正所谓知己知彼方能百战不殆。
2024-09-09 10:24:15 1418
原创 LLM大模型基础知识学习总结
但是,在AI Agent时代,很多情况下不需要把这些指令一个一个地指出来,只需要一句话就行了,比如说提供一个prompt“请帮我完成一个用户系统,它包含用户注册、登录、查询等功能”,然后大模型就会帮你去完成。这个生成的过程我们叫做面向目标的架构,具有。
2024-09-09 09:47:46 1302
原创 五分钟带你学习LangChain 框架
ConversationEntityMemory,通过该函数来总结并记住特定实体的信息。它使用LLMs提取实体的信息,并移逐渐建立对实体的了解(通过LLMs的能力)。ConversationSummaryMemory 这种记忆类型可以创建关于对话的摘要,有助于从对话中概括信息。概括能力仍然需要llm。
2024-09-08 09:15:00 623
原创 教你迅速上手LangChain:十分钟入门到精通,一篇文章足矣!
在这种情况下,提示不仅包含有关内容的信息,还包含每个消息(其角色、其在列表中的位置等) 在这里,最常见的是ChatPromptTemplate是ChatMessageTemplate的列表。这个链组件将接收输入变量,将其传递给提示模板以创建提示,将提示传递给LLM,然后通过一个(可选的)输出解析器将输出传递出去。在前面的示例中,我们传递给模型的文本包含了生成公司名称的指令。观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
2024-09-08 08:00:00 1452
原创 学习AI大模型在2024年到底有多重要?
随着科技的飞速发展,我们正处在一个智能化的时代。2024年,AGI(人工通用智能)大模型即将成为改变我们生活的重要力量。它不仅将引领科技产业的变革,还将为我们的日常生活带来巨大的影响。AGI大模型的重要性不仅体现在其技术本身,更体现在其对我们生活的深远影响。它将改变我们的工作方式,提升我们的生活质量,推动社会的发展。因此,学习AGI大模型,了解其背后的原理和应用,对于我们来说至关重要。在2024年,AGI大模型将成为科技发展的关键力量。它将引领我们进入一个全新的智能时代,为我们带来前所未有的便利和机遇。
2024-09-07 08:45:00 897
原创 如何训练一个大语言模型(LLMs)
在当今数字时代,语言模型已经成为自然语言处理任务的强大工具,从文本生成到情感分析和机器翻译等各个方面都有涉猎。然而,训练这些模型需要仔细的规划、大量的计算资源以及机器学习技术方面的专业知识。那么一个大型语言模型(LLMs)到底是如何训练出来的呢?在查阅了解之后,我们将相关内容整理出来。在本文中,将和大家一起探讨训练LLMs所涉及的步骤,欢迎各位读者指正与补充。本文探讨了训练大型语言模型(LLMs)的过程步骤,从数据处理到模型评估和实际应用。
2024-09-07 08:30:00 1499
原创 2024年国内 AI大模型产业发展深度分析
文心一言是百度研发的人工智能大语言模型产品,具备跨模态、跨语言的深度语义理解与生成能力,在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等众多领域都能为用户提供高质量服务。文心一言拥有四大基础能力:理解能力、生成能力、逻辑能力、记忆能力。(2)大模型优势:2023 年 10 月发布的“文心大模型 4.0”,相比上一代文心大模型,四大能力显著升级,其中逻辑提升幅度是理解的 3 倍,记忆提升幅度是理解的 2 倍。
2024-09-07 08:00:00 1806
原创 初识LangChain的快速入门指南
LangChain是一个基于大语言模型用于构建端到端语言模型应用的框架,它提供了一系列工具、套件和接口,让开发者使用语言模型来实现各种复杂的任务,如文本到图像的生成、文档问答、聊天机器人等。复制代码开发阶段:使用LangChain的开源构建块和组件构建应用程序,利用第三方集成和模板快速启动。生产化阶段:使用LangSmith检查、监控和评估您的链,从而可以自信地持续优化和部署。部署阶段:使用LangServe将任何链转化为API。
2024-09-06 21:02:47 1268
原创 什么是大模型?一文读懂大模型的基本概念!
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
2024-09-06 20:44:04 1177
原创 从理论到实践:AI大模型学习路线,提升核心竞争力,看这篇就够了
大模型,通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑,这些大脑通过阅读大量的文本、图片、声音等信息,学习到了世界的知识。这些大脑(模型)非常大,有的甚至有几千亿个参数,这些参数就像是大脑中的神经元,它们通过复杂的计算来理解和生成语言、图片等。举个例子,你可能听说过GPT-3,它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问题,然后给出回答,或者根据你给它的提示,生成一篇文章、一个故事,甚至是一段代码。
2024-09-06 20:41:42 997
原创 2024大模型学习全攻略:从小白到专家,一站式进阶之路
随着人工智能技术的迅猛发展,大模型(Large Models)已成为这一领域的新宠。从GPT系列到BERT,再到各类变体,大模型以其强大的能力吸引了无数开发者和研究者的目光。那么,作为一个零基础的学习者,如何快速入门并精通大模型技术呢?本文将为你提供一份详尽的学习指南。一、大模型基础概念在开始深入学习之前,我们需要了解大模型的基本概念和特点。大模型通常指的是参数量巨大、结构复杂的神经网络模型,它们能够处理海量的数据,并具备强大的学习和推理能力。二、学习路径规划数学基础。
2024-09-06 20:40:11 826
原创 终于!有人总结了大模型学习资料!
它借助人类的反馈学习偏好,旨在消除偏见、优化模型,使它们更加符合人类的期望。词嵌入,作为一种独特的词表示形式,赋予了具有相近内涵的词汇相似的形态,使它们在语义空间中彼此亲近。任务特定基准:在摘要、翻译、问答等细分任务领域,有着各自专用的评价基准、指标和子领域(如医学、金融等)的特定要求,例如PubMedQA,为生物医学问答领域提供了精准的评价工具。但并非不可能,作者:kaiokendev:在这篇博文中,作者深入探讨了SuperHOT技术,并为我们带来了关于相关工作的精彩解读,为读者呈现了一个宏大的视角。
2024-09-05 14:07:36 1444
原创 大模型入门基础概念介绍
人类的语言是由文字构成,语言的含义也是由单词构成的,即单词是含义的最小单位。因此,为了让计算机理解自然语言,寻找数字表示的方法是第一步。⾃然语⾔是⽤来表达⼈脑思维的复杂系统。在这个系统中,词是意义的基本单元。顾名思义,词向量是⽤于表⽰单词意义的向量,并且还可以被认为是单词的特征向量或表⽰。将单词映射到实向量的技术称为词嵌⼊。
2024-09-05 14:04:20 570
原创 大模型学习方法之——大模型技术学习路线
经验总结:定期回顾学习过程,总结技术要点和实战经验跨学科融合:探索大模型在其它领域(如金融,法律,医疗等)等应用,扩展知识广度如果用一句话总结就是,学习——实践——再学习——再实践。。
2024-09-05 14:00:05 1129
原创 大模型技术学习过程梳理
从大的方向上来说,大模型从技术到应用,主要涉及到以上几个大的模块;而每个模块又涉及到大量的技术和细节。比如打造不同任务的神经网络模型,强化学习,迁移学习,知识蒸馏,分布式训练与存储等;以及RAG使用的向量检索,向量数据库,语义理解等,还有复杂任务的思维链(CoT),模型训练使用的LoRa等微调方法。还有多模态模型中的知识对齐,数据融合等复杂技术。基于大模型开发的人工智能机器人,感兴趣的可以点击查看:
2024-09-05 13:57:41 704
原创 大模型相关基础知识学习
提示工程也叫「指令工程」。- Prompt 就是你发给大模型的指令,比如「讲个笑话」、「用 Python 编个贪吃蛇游戏」、「给男/女朋友写封情书」等。
2024-09-02 21:40:57 1894
原创 从理论到实践:AI大模型学习路线,提升核心竞争力,看这篇就够了
大模型,通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑,这些大脑通过阅读大量的文本、图片、声音等信息,学习到了世界的知识。这些大脑(模型)非常大,有的甚至有几千亿个参数,这些参数就像是大脑中的神经元,它们通过复杂的计算来理解和生成语言、图片等。举个例子,你可能听说过GPT-3,它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问题,然后给出回答,或者根据你给它的提示,生成一篇文章、一个故事,甚至是一段代码。
2024-09-02 21:33:29 1220
原创 经验分享,AI小白的大模型学习过程!
导读写这篇文章的初衷:作为一个AI小白,把我自己学习大模型的学习路径还原出来,包括理解的逻辑、看到的比较好的学习材料,通过一篇文章给串起来,对大模型建立起一个相对体系化的认知,才能够在扑面而来的大模型时代,看出点门道。为什么要写这篇文章?首先我关注到了两个变化。
2024-09-02 21:32:19 1455
原创 如何用大模型提升学习效率?(非常详细)
自从2022年底ChatGPT横空出世以来,在过去的十几个月里,生成式人工智能的浪潮席卷并改变着各行各业。2023年一月,在线课程供应商Study.com曾向1000名18岁以上的学生发起的一项调查显示,当时就已经有超过89%的学生使用ChatGPT来完成家庭作业,53%的学生用ChatGPT写论文。无独有偶,在线杂志Intelligent同时期针对在校大学生的一项研究也显示,有60%以上的受访者表示一半以上的作业都使用了ChatGPT。图片来自Intelligent 2023年1月的调查研究。
2024-09-02 21:30:23 976
原创 转行AI大模型开发难吗?需要学些什么?怎么学才能找到工作?
转行AI大模型开发难吗?怎么学才能找到工作?这应该是所有新人都会面临的问题,所以我结合自己的经历,做了一些总结和学习方法,希望能对大家有所帮助。
2024-08-27 12:07:57 911
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人