自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(728)
  • 收藏
  • 关注

原创 2024年新书-《掌握大语言模型》免费pdf分享

《掌握大语言模型》这本书是自然语言处理(NLP)和大语言模型(LLMs)领域的一本重要参考书籍,适合那些希望深入了解和应用这些强大语言模型的朋友们。该书不仅仅是理论探讨,而是通过实际操作手把手教读者如何构建和应用这些强大的语言模型。

2024-08-24 16:38:16 438

原创 2024汽车AI大模型TOP10分析报告

大模型的发展历程中,Google提出的Transformer框架受到关注,众多预训练模型涌现,OpenAI的系列模型引领了大模型时代的浪潮。汽车行业大模型分为通用大模型、行业大模型和自动驾驶垂类大模型三类。该报告基于汽车行业AI大模型的应用现状与发展趋势,精心评选出TOP10企业,旨在为广大读者呈现当前汽车行业中最具竞争力的AI大模型解决方案。这些企业涵盖了通用大模型、行业大模型及场景大模型等多个领域,展现了各自在自动驾驶、智能座舱、多模态交互和端侧部署等方面的独特优势与创新能力。

2024-08-24 16:17:13 190

原创 大模型如何引领具身智能新发展?(28页 PPT 可编辑)

具身智能是指支持感觉和运动能力的物理智能体,像人类一样通过视觉、听觉、触觉等感官,以及语言、运动、交互等行为,完成一系列智能任务的能力。面向多模态数据的稀缺性和多样性、具身智能模型的复杂性和可扩展性、验证环境的规范性和统一性,以及虚拟到现实的泛化性等挑战性问题,以下报告总结当前具身智能领域的前沿进展,并通过圆桌讨论的形式深入分析和探讨当前现状、研究内涵和未来路线,期望能够总结更多共识、提供更多启迪、推动领域发展。

2024-08-24 11:55:56 49

原创 从工程师视角看大模型训练

今年,我们内部对从 pretrain 到 sft 的整个大模型训练流程进行了翻新,模型能力上也有了比较明显的提升,我也在这个过程中对训练有了更深入的理解,在这里分享一下,也算是对自己工作以来最累的一段时光的记录。从方法论的角度,我认为这次翻新的核心在于,。一般认为,大模型的训练团队应该由这么 2 波人组成:一波是像 Ilya Suskever 或者 John Schulman 这样的研究人员来提供研究目标与实验方案;

2024-08-22 11:59:08 559

原创 神奇的Embeddings模型,大大简化输入提示词

Pony模型是一场AI大模型的革命,让Stable Diffusion世界变得五彩斑斓。如今,80%的新增大模型都是以Pony为底模进行创作。但Pony系列的缺点也显而易见:打分机制非常繁琐。如果不使用打分,出图效果比较差。虽然之前我推荐了免打分的二创模型,但出图效果在不打分的情况下,达不到最优,只是勉强可看。今天给大家推荐一组Embedding模型,体积小,名字短,好记忆,可以方便的取代打分机制。Embedding模型,英文意思是:嵌入。通常我们称之为文本嵌入(也叫词嵌入)。

2024-08-22 11:39:03 711

原创 大模型应用落地:如何选择合适的 Embedding 模型?

在生成式人工智能(GenAI)领域,检索增强生成(RAG)作为一种策略脱颖而出,它通过集成外部数据来扩充像 ChatGPT 这样的大型语言模型(LLM)的现有知识库。RAG 系统核心涉及三种关键的人工智能模型组件:嵌入(Embedding)模型负责将信息转化为数学向量,重排名(Reranker)模型则用于优化搜索结果,而强大的基础语言模型确保了丰富的语境理解和生成。本篇文章旨在指导您依据数据特性及目标领域,比如:金融专业,来挑选最合适的嵌入模型,从而最大化 RAG 系统的效能与准确性。

2024-08-22 11:03:11 712

原创 你想在本地部署大模型吗?本地部署大模型的三种工具

人工智能的发展如火如荼,也让越来越多的人了解到人工智能;而对大部分人来说使用的都是第三方提供的客户端,不论是网页版,还是PC端或移动端。那么,我们怎么在本地部署一款大模型呢?下面就来介绍三种工具。01本地部署大模型的三种工具‍‍_‍gpt4all是一款可以本地部署大模型的客户端工具,其支持window,macOS和ubuntu(一款linux桌面系统)系列。‍‍其官网地址:https://gpt4all.io/index.html。

2024-08-21 11:57:52 748

原创 轻松上手!手机上部署Phi3、Llama3最新大模型全攻略!

大模型无疑是此次AI革命的主角,大模型基于Scaling Law(缩放定律)。简单的说,就是数据越多,参数越大,算力越强,模型最终的能力就越强。随着模型参数和预训练数据规模的增加,模型能力与任务效果不断改善,展示出了一些小规模模型所不具备的“涌现能力”。

2024-08-21 11:50:39 692

原创 小白速成教程:私有化大模型+知识库

这是一套简单稳定,小白可操作的方案,同时支持后续深入学习更高阶的操作。搭建完之后,你就可以随时随地无需网络,不用担心隐私泄露的使用你自己的专属知识库的大模型聊天机器人了!

2024-08-21 11:42:00 551

原创 AI应用 | 【AI+工业】LLM(大型语言模型)在工业领域中的十个应用

随着时间的推移,LLM(大型语言模型)的特性和能力逐渐为人们所熟知。它们展现了无与伦比的人类语言理解、出色的文本生成能力以及友好的对话指令跟随倾向。而像GPT-4和Claude等更为强大的LLM则展现出了对现实世界因果关系的深刻理解。据报道,GPT-4甚至采用了八个与GPT-3.5规模相当的LLM,通过混合专家(MoE)的方式进行配置。

2024-08-20 21:01:18 809

原创 这就是大语言模型! | 一文梳理LLM中的核心概念

牛顿运动定律并不是“先知”告诉牛顿的,而是牛顿本人经过观察、测量、记录、思考、假设、验证等一系列步骤后总结出来的。这个总结的过程就是建立模型的过程,最后得到的结论就是一个模型。有些模型是有名字的,比如“牛顿第一、第二、第三运动定律”。根据建立的模型,我们可以直接计算出给定条件(输入)下我们关心的问题的结果是什么(输出),这也就是用模型进行“预测”的过程,这一过程有时候也叫做“推理”。为人类语言文本建立的模型就是语言模型。大语言模型的“大”体现在模型的参数量很多,比如ChatGPT有1750亿个参数。

2024-08-20 20:46:58 913

原创 多模态交互智能体(Agent)全面综述:定义、范式、学习、系统、分类、应用、评估

多模态AI系统很可能会成为我们日常生活中无处不在的存在。使这些系统更具交互性的一种有希望的方法是将它们作为物理和虚拟环境中的智能体。目前,系统利用现有的基础模型作为创建具身智能体的基本构建块。将智能体嵌入这些环境中,有助于模型处理和解释视觉和上下文数据,这对于创建更复杂和上下文感知的AI系统至关重要。例如,一个能够感知用户行为、人类行为、环境对象、音频表达和场景集体情感的系统,可以用来通知和指导给定环境中智能体的响应。

2024-08-20 20:39:00 764

原创 多模态大模型技术白皮书 2024

不同于语言大模型只对文本进行处理,多模态大模型将文本、语音、图像、视频等多模态数据联合起来进行学习。多模态大模型融合了多种感知途径与表达形态,能够同时处理和理解来自不同感知通道(例如视觉、听觉、语言和触觉等)的信息,并以多模态的方式表达输出。现有的多模态大模型主要有面向理解任务的、面向生成任务的、兼顾理解和生成的、知识增强的多模态大模型。面向理解任务的多模态大模型,其核心结构通常是 基于Transformer 的编码器。按照模型结构的不同,面向理解任务的多模态大模型又可再分为单流和多流两种结构。

2024-08-20 20:26:26 532

原创 部署私有化大模型ollama,造一个私人小秘书

windows 的安装默认不支持修改程序安装目录, 默认安装后的目录:C:\Users\username\AppData\Local\Programs\Ollama 默认安装的模型目录:C:\Users\username\ .ollama 默认的配置文件目录:C:\Users\username\AppData\Local\Ollama。💥观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。即可和大语言模型对话。

2024-08-18 20:15:00 1194

原创 10分钟私有化部署大模型到本地

Ollama是一个开源的大型语言模型(LLM)服务工具,它旨在简化在本地运行大语言模型的过程,降低使用大语言模型的门槛。收录了52个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。可以看到已经使用qwen2:0.5b回答了。在Ollama的模型仓库https://ollama.com/library,查找你喜欢的模型,为了测试方便我们可以找一个tiny点的大模型。

2024-08-17 15:30:00 805

原创 一文详细梳理!大模型从理论到实战落地必备干货!

在人工智能的浩瀚星辰中,大模型犹如璀璨的北极星,引领着技术的前沿方向。它们不仅代表了深度学习领域的最新突破,更成为了推动各行各业智能化转型的关键力量。本文笔者总结了大模型从理论研究到实战落地所需具备的所有知识干货,与大家分享~

2024-08-16 15:23:52 664

原创 AI知识库检索增强生成(RAG)简介

检索增强生成(RAG)是通过从外部知识源纳入额外信息来增强大型语言模型(LLM)的过程。这能使 LLM 生成更准确、更能感知上下文的答案,同时还能减少幻觉。在回答问题或生成文本时,首先要从现有知识库或大量文件中检索相关信息。然后使用 LLM 生成答案,通过纳入这些检索到的信息来提高答案的质量,而不是仅仅依靠 LLM 来生成答案。下图展示了 RAG 的典型工作流程:RAG 的典型工作流程编制索引:索引编制过程是离线执行的重要初始步骤。

2024-08-15 17:54:14 921

原创 Qwen2大模型微调入门实战(完整代码)

是通义千问团队的开源大语言模型,由阿里云通义实验室研发。以Qwen2作为基座大模型,通过指令微调的方式实现高准确率的文本分类,是学习的入门任务。指令微调是一种通过在由(指令,输出)对组成的数据集上进一步训练LLMs的过程。其中,指令代表模型的人类指令,输出代表遵循指令的期望输出。这个过程有助于弥合LLMs的下一个词预测目标与用户让LLMs遵循人类指令的目标之间的差距。在这个任务中我们会使用模型在数据集上进行指令微调任务,同时使用SwanLab进行监控和可视化。

2024-08-14 16:06:08 708

原创 LangChain4j系列:LangChain4j ChatMemory聊天记忆详解与实战

LangChain4j系列:LangChain4j ChatMemory聊天记忆详解与实战

2024-08-14 15:58:34 1037

原创 《深入浅出LLM 》:大模型基础知识

上下文学习,模型以输入的提示(一段自然语言,包括任务描述,零或少量示例,推理类问题上还包含推理步骤)为条件补充生成后面的文本,本质是条件生成p(output | prompt, model),与自回归模型的预训练目标是一致的。[the, ⊔,c,a,r]\sqcup , c, a, r]⊔,c,a,r], [the, ⊔,c,a,t],[\sqcup , c, a, t],[⊔,c,a,t],[ the, ⊔,r,a,t]\sqcup , r, a, t]⊔,r,a,t] (the 出现了 3次)

2024-08-14 15:47:33 790

原创 3K star!LLM读不懂?那用可视化的方式来学吧

项目提供了一个让零基础初学者更好地了解大语言模型工作原理和内部机制的方法,通过llm-viz 提供的可视化工具来直观地展示大模型的结构和运作。这样的工具对于教学、研究和理解模型内部机制非常有帮助。

2024-08-13 16:14:44 1008

原创 解密大模型训练、微调和推理运行时的性能问题

本文介绍了香港科技大学与北京大模科技的研发团队对不同大小LLMs在多种GPU平台上的性能作出的基准测试。大型语言模型(LLMs)在学术和工业界都取得显著进展,推动了开源框架和技术的更新,以加速LLMs的训练和应用。然而,在不同硬件和软件配置下,性能差异显著。香港科技大学(广州)褚晓文教授团队与北京大模科技研发团队合作对不同大小LLMs在多种GPU平台上的性能进行了基准测试,包括各种优化技术,还深入分析了LLMs的子模块,包括计算和通信操作。

2024-08-09 18:01:23 243

原创 大模型「训练」与「微调」概念详解【6000字长文】

1、大模型预训练与微调的基本流程2、预训练、训练、后期预训练、微调的区别3、大模型训练与微调的一些概念,如:Post-pretrain、SFT、RLHF、模型对齐、Lora、Q-Lora、大模型量化、微调指标、微调参数、大模型评测指标在大模型的预训练与微调过程中,我们通常面临如何告诉模型想要什么答案和不想要什么答案的问题(后者往往被大家忽略)。本节将详细阐述大模型预训练与微调的流程,包括预训练、微调的两个阶段(监督式微调SFT和对齐阶段)以及在实际操作中可能遇到的问题和解决方法。总结来说,

2024-08-09 17:55:10 1025

原创 如何成为一名AI产品经理?

(1)需要掌握的基础知识不同(2)拥有的技术知识不同(3)用户群体侧重点不同(4)产品需求来源及内容不同(5)技术方案考量维度不同03智商:衡量自我智力和学习能力的标尺;情商:衡量认知自我和他人情绪能力的标尺;机器商:衡量跟机器协同合作的能力的标尺。机器的本质是代码,代码的核心是算法,机器有机器算法,AI产品经理也必须有产品经理该有的算法,或者提升自己机器商的算法。

2024-08-07 16:06:28 629

原创 【全网最全】AIGC产品经理面试高频100题答案解析

重大更新!!!咱们的《AIGC面试高频问题以及算法模型精讲》干货大礼包再次更新啦!!这次新增了20道面试高频题目的答案详细解析,凡是下单的小伙伴后续更新都可以免费看。目前面试问题总共100道!1)目前干货文档总字数万,不管是模型基本功还是每个问题的答案都尽可能详尽;2)重点给大家深度讲解了机器学习、深度学习、AIGC三个大方向的经典模型3)每个模型从三个产品经理必懂的维度深度讲解,结合应用案例更易于大家理解4)从百度、腾讯、字节、商汤、科大讯飞等面试精选AI面试高频面试30题,5)高频面试总共。

2024-08-05 17:41:23 744

原创 AI大模型时代,产品经理需要了解什么?

prompt是发送给大模型的指令,看似门槛低,但实际上要做好也是需要一些技巧和经验的。有的人调试出来的prompt好用,而有人总是出不了稳定的效果。这就好比人类之间的沟通一样,有人的善于沟通,把事情讲的清清楚楚,滴水不漏,对方很容易理解,而有的人总是词不达意,甚至造成误会(幻觉)。我个人认为,prompt能力是可以反映产品经理的综合素养的。当然了,在未来,prompt会是AI大模型时代所有人的通用能力。:模型从尺寸上讲,有大模型和小模型;从开放性上讲,有开源模型和闭源模型。

2024-08-05 17:11:34 529

原创 立志投身大模型领域?AI产品经理必读:转行攻略指南

大模型是AI领域的一个重要趋势,具有强大的泛化能力和适应能力,在多个任务和领域上表现出惊人的成就。大模型可以利用海量的数据来学习通用的知识和能力,从而在多个场景和需求上提供高效的解决方案。大模型可以带来更好的用户体验和商业价值,在各个行业和领域中创造更多的创新和变革转行做。大模型需要海量的数据和计算资源来训练和运行,对于硬件设备、网络带宽、存储空间等方面有很高的要求。大模型涉及到很多前沿的理论和实践,对于知识水平、技术能力、学习能力等方面有很高的要求。

2024-07-29 15:58:26 746

原创 大模型真能变现!这批打工人,干着大厂的活,赚着副业的钱!!_大模型 变现

当你还在和ChatGPT尬聊时,已经有人用它搞到钱了。前段时间,国外网友给ChatGPT 100美元自创业,搭建网址、内容策划、传播全都AI搞定,甚至LOGO都是由Dall-E设计的。公司运作2天,估值飙升到25000美元。看到ChatGPT的羊毛这么容易薅,网友也纷纷按捺不住了。其实,还有另一个用「ChatGPT」赚钱的门道,而国内已经有开发者,用ta赚到了第一桶金。一次偶然经历,诞生一个项目此前,无空从未能想到,一次在家「休假」的机会,竟然让自己做起了一个项目。

2024-07-29 15:48:18 440

原创 从零开始(大白话)认知大模型--AI2.0新宠儿_怎么和小白说大模型

定义大模型是大家看科幻片里面的仿生人(人造人)的大脑,它是仿生人学习整个世界的知识形成的具有感知、认识的大脑,能够进行预测和决策,专业点说法就是大模型是一个具有大规模参数量的初始网络结构在载体芯片上对世界上的庞大数据进行学习,最终形成的一个高度浓缩了海量知识的高级网络结构,类似于新生儿对世界无知的大脑通过不断学习,发育为拥有大量社会知识的成人大脑。大模型低级目标是特征提取,高级目标是世界模型。

2024-07-29 15:42:03 886

原创 我们公司落地大模型的路径、方法和坑

假设我们正在构建一个 RAG 系统来生成 SQL 查询。我们可以简单地提供表模式和列名作为上下文。但是,如果我们包括列描述和一些代表性值呢?额外的细节可以帮助 LLM 更好地理解表的语义,从而生成更正确的 SQL。

2024-07-18 10:39:34 798

原创 钉钉请来一屋子大模型,要把开放的大旗扛到底

有很多,一类是创作类,因为公司里面的人大部分时间都在做创作,无论是员工还是设计部门还是营销部门,做文案,做规划,做营销的海报都是做创作,这是AI时代新的创作模式。以往的创作要切换各种应用,系统之间协同也挺麻烦,在使用多个独立的AI平台时,创作产品协同起来很烦,钉钉上可以协同,不仅自己可以协同,还可以跟别人协同。另外一类是RPA类,RPA其实在没有AI的时候已经有点起色,传统RPA是手工点来点去,批处理变成自动化流程,有了AI加持以后,RPA变得更智能。

2024-07-18 10:29:26 754

原创 还不试试AI大模型?能让你少加点班!

收录了52个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。💥观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

2024-07-18 10:26:09 314

原创 阿里大模型,拿下全球第一

作为阿里云精心筹备的“大招”,通义千问第二代开源模型Qwen2-72B亮相即登顶。6月27日凌晨,全球著名开源平台Hugging Face(笑脸)的联合创始人兼首席执行官在社交平台表示,在新一轮的全球开源大模型评估中,阿里开源的Qwen2-72B力压科技兼社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral,荣登榜首。图源:微博截图据阿里云官方介绍,Qwen2-72B在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型。

2024-07-18 10:11:12 1055

原创 聊聊普通工程师如何入坑大模型 | 附超详细教程!

因为我整天都在忙着钻研大模型前几天,跟强哥一起吃饭。他说,大模型的技术,真是太好玩了!他买了一台超高配置的游戏本,本来是想买回来打游戏放松放松的。结果后来发现,玩大模型的技术,比打游戏好玩太多了!我连连表示赞同,不错不错,关键是游戏本没白买啊,跑大模型正好也用得上😀(强哥是谁?不重要,你只需要知道是一位登上人生巅峰的技术大佬就好了)认真地说,以大语言模型 (LLM) 为核心的AI技术,正在如火如荼地席卷整个行业。

2024-07-16 22:25:52 890

原创 GLM-CookBook:GLM 大模型入门指南

2024年1月16日,伴随着 GLM-4 系列模型发布,全新的智谱AI第四代 API 也进入视角,第四代API 在实用性,稳定性上都做出了提升,但与第三代API有所变化。为助力大模型开发者更好地使用 GLM 系列大模型(特别是 GLM-4 等模型的API),我们联合社区开发者,共同推出了 GLM cookbook 开源项目。这个教程仓库提供了丰富的代码示例、实用指南以及资源链接,旨在帮助用户轻松掌握GLM API 的使用。该仓库覆盖了从基本API调用到高级功能的多方面内容,适合不同层次的用户。

2024-07-16 22:17:05 580

原创 产品经理内容分享:AI产品经理的入门路线图

AI技术的核心是模仿人类的学习和决策过程,以在特定任务上达到并超越人类的表现。机器学习是实现AI的一种手段,它使计算机能够通过数据学习和改进。在机器学习中,算法通过对大量数据的分析学习,捕捉数据的模式和规律,并用于预测或分类任务。深度学习是机器学习的一个分支,它以人工神经网络为基础,尤其善于处理视觉和语言识别问题。深度学习模型通常需要海量的数据来训练,它可以识别和利用这些数据中的复杂模式。AI产品经理需要理解这些原理,才能准确地与团队成员和利益相关方沟通,并作出明智的决策。

2024-07-12 11:09:46 1050

原创 闲聊人工智能产品经理(AIPM)—定义人工智能产品经理

传统的互联网是优化和创造信息存贮和传递的方式对生产要素进行整合,通俗讲就是在当前的生产要素下优化消息传输,提升生产效率,重构已有的商业模式。人工智能则是对生产要素进行升级,产生新的商业模式。还是举个例子:在互联网时代,我们出行用的是某滴之类的打车软件,本质上还是乘客打车,司机开车收取报酬,不同的是把以前路边打车整合成线上和线下结合的方式,还是司机开车乘客坐车,最终的结果是没有改变生产要素,只是生产要素和资源配置方式的优化和升级。人工智能就完全不同!

2024-07-12 10:50:46 877

原创 作为普通产品经理,转AI产品经理,需要做哪些准备?

我认为的Ai产品经理,其实它是在通用产品经理的基础上,增加了一个显著能力,就是如何运用现有的AI技术去帮助客户解决问题,并在原有工作效率,或用户体验上起到增强的效果。

2024-07-12 10:49:19 635

原创 从理论到落地,大模型评测体系综合指南

1956年夏,“人工智能” 这一概念被提出。距今已有近70年的发展历史。中国科学院将其划分为六个阶段:起步发展期(1956年—1960s),反思发展期(1960s-1970s),应用发展期(1970s-1980s),低迷发展期(1980s-1990s),稳步发展期(1990s-2010),以及蓬勃发展期(2011-)。真正的大模型历史还要从2006年Deep Learning首次在Science上发表开始,然而在2012年之前,大模型的探索与学习的关注度并不是很高。

2024-07-11 10:10:11 434

原创 大模型的落地场景有哪些?看华为、吉利、工行等10家企业的最佳实践_大模型应用场景

大模型正以其前所未有的规模和深度,重塑着我们的世界。从金融科技到智能制造,从编码助手到数据分析,大模型在多个领域展现出惊人的能力,并在实际应用中展现出巨大的潜力和价值。当前,大模型的落地场景包括等,沙丘社区精选出各个场景下落地效果较好的10个最佳实践案例,涉及等10家企业,为企业大模型落地提供参考。上汽乘用车年均销售数量近百万辆,车主日均咨询量几万+,问题经验获取平均时长为十几分钟。

2024-07-11 10:09:23 548

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除