- 博客(673)
- 收藏
- 关注
原创 大模型开发:第一批用 LangChain 的程序员,早就已经碾压同事了。。
今年招聘市场确实是好点了,我发现群友都在讨论,得赶快学点 AI 大模型。
2024-05-24 17:46:11 173
原创 大模型最新黑书:大模型应用解决方案: 基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理 PDF
这本书犹如一道闪电,照亮了我在AI领域前行的道路。它不仅仅是一本书,更是一把钥匙,为我打开了通往AI新世界的大门。
2024-05-24 17:41:57 169
原创 产品经理书籍:<AI赋能:AI重新定义产品经理>推荐一波
随着AI在越来越多的行业被应用,AI赋能的价值逐步体现出来,大模型跟产品经理可以说是绝配,而本书的含金量对产品经理来说的不用多做介绍,在这里给大家强烈推荐一波,不多bb直接开始介绍!
2024-05-24 17:41:25 176
原创 AI产品经理的入门必修课——案例篇
人每天做的最多的事情就是看、听、说、思考、决策,这是人这个复杂系统需要具备的能力,那么如果要做像人一样的智能机器,最基础要解决的问题便是图像处理的能力、声音的处理能力、口语的处理能力、逻辑推理能力,具备了这些能力之后,人才能做更多的事情,同理机器也就能做更多的事情。
2024-05-23 10:44:30 620
原创 AI产品经理的入门必修课——实战篇
本篇计划介绍一下机器学习的实际训练过程,来进一步的理解AI产品在日常工作中需要关注的内容。现简单的将训练流程划分为:定位要解决的任务类型 -> 选择合适的算法模型 -> 准备数据集 -> 训练模型 -> 调整参数 -> 模型评估及验收。
2024-05-23 10:42:38 562
原创 年薪50W+,这个AI岗会越来越值钱!
近两年,“AI、人工智能” 一度成为产品圈火热讨论的话题。不少产品人也在纠结到底要不要转岗做AI产品经理。
2024-05-23 10:22:07 251
原创 大模型的好伙伴,浅析推理加速引擎FasterTransformer
最近几个月,随着ChatGPT的现象级表现,大模型如雨后春笋般涌现。而模型推理是抽象的算法模型触达具体的实际业务的最后一公里。
2024-05-22 09:21:10 512
原创 大杀器,多模态大模型MiniGPT-4入坑指南
ChatGPT的发布给大家带来了不少的震撼,而随后发布的GPT-4更是展现了非凡的多模态能力。但是,ChatGPT和GPT4官方公布的细节很少,OpenAI俨然走上了闭源之路,让广大AI从业者又爱又恨。
2024-05-22 09:19:53 777
原创 AI产品经理 与 数据产品经理有什么区别
人工智能快速渗入各行业,AI产品经理需求量大,成为稀缺人才。"AI产品经理"项目面向希望利用AI技术推动业务发展的产品经理和商业领导者。
2024-05-21 11:36:49 701
原创 LLM大模型,产品经理已经开始“抢人”了!
随着大模型在国内这片土壤生根发芽,企业对相关人才的争夺也愈发激烈,在招聘软件上我们不难看到,不少企业甚至开出高年薪以抢夺算法、深度学习等高级技术人才。
2024-05-20 10:02:54 482
原创 产品经理AI对话(二):Prompt不只是一句话
很大程度上,Prompt的结构与内容会对最后模型的输出能力产生极大影响,所以,我们需要做好Prompt的设计。这篇文章里,作者就对Prompt如何构建等问题做了分享,一起来看。
2024-05-20 10:01:51 295
原创 产品经理AI对话(一):了解大语言模型
对想做AI产品经理的同学而言,了解一些基础知识、常用名词是必须的。这篇文章,作者解释了一些AI的基础名词和概念,希望可以帮到大家。
2024-05-20 10:00:47 549
原创 【AI产品经理】第十四篇-AI产品经理必备的大模型知识
大型语言模型是一种基于人工智能技术的模型,它能够处理和生成自然语言文本。这些模型通常由数十亿到数万亿个参数组成,通过深度学习技术从大规模文本数据中进行训练。
2024-05-18 10:18:34 230
原创 AI大模型产品经理学习笔记(一)学习路径
AI随着大模型的爆发,成为了当下最新的风口,AI有可能是继十几年前移动互联网爆发以来,又一个持续十年甚至更久的机遇。对于产品经理来说,转行AI大模型当下无疑是最好的时机。
2024-05-18 10:17:31 247
原创 CRAG-可矫正的检索增强生成
前面有聊过self-RAG通过大模型决策,提升了RAG系统的效果,本期给大家介绍一个更为简便、优秀的插件式决策模块CRAG。
2024-05-17 11:59:12 862
原创 80% 的人连基本的提示词都写不好
从定义触发,AI 跟人类甚至动物的智能类似,随着时间的推移,能够从环境、教育、经验等外部资料中汲取知识,不断训练成长,最终达到一定智能水平,做出相应的智能决策。
2024-05-16 14:50:15 529
原创 解密Prompt系列12. LLM Agent零微调范式 ReAct & Self Ask
看完了SelfAsk和React的实现,不难发现二者存在一些局限性更适合简单的工具调用:这里的简单是指工具的输入和上文的文本语义比较符合,工具输入比较“自然语言”风格例如搜索。高度结构化和符号化的工具输入,使用Prompt实现,准确率比较有限。更适合少量的工具组合:受限于Prompt上文的长度,不能把几十个工具prompt全塞进去,因此更适合少量的工具组合一般是3~5个以内。
2024-05-15 10:00:00 714
原创 解密Prompt系列11. 小模型也能COT-先天不足后天来补
前两章我们分别介绍了COT的多种使用方法以及COT的影响因素。这一章更多面向应用,既现实场景中考虑成本和推理延时,大家还是希望能用6B的模型就不用100B的大模型。
2024-05-15 08:30:00 854
原创 解密Prompt系列10. 思维链COT原理探究
前一章[思维链基础和进阶玩法]()我们介绍了如何写Chain-of-thought Prompt来激活生成逐步推理,并提高模型解决复杂问题的能力,这一章我们追本溯源,讨论下COT的哪些元素是提升模型表现的核心?
2024-05-15 07:30:00 667
原创 解密Prompt系列9. LLM复杂推理-思维链基础和进阶玩法
终于写了一篇和系列标题沾边的博客,这一篇真的是解密prompt!我们会讨论下思维链(chain-of-Thought)提示词究竟要如何写,如何写的更高级。
2024-05-14 09:30:00 606
原创 解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE
这一章我们聊聊有哪些方案可以不用微调直接让大模型支持超长文本输入,注意这里主要针对无限输入场景。
2024-05-14 07:45:00 913
原创 解密Prompt7. 偏好对齐RLHF-OpenAI·DeepMind·Anthropic对比分析
前三章都围绕指令微调,这一章来唠唠RLHF。何为优秀的人工智能?抽象说是可以帮助人类解决问题的AI, 也可以简化成3H原则:Helpful + Honesty + Harmless。
2024-05-14 07:00:00 891
原创 解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~
上一章介绍了如何基于APE+SELF自动化构建指令微调样本。这一章咱就把微调跑起来,主要介绍以Lora为首的低参数微调原理,环境配置,微调代码,以及大模型训练中显存和耗时优化的相关技术细节
2024-05-13 09:15:00 1000
原创 解密prompt系列5. APE+SELF=自动化指令集构建代码实现
上一章我们介绍了不同的指令微调方案, 这一章我们介绍如何降低指令数据集的人工标注成本!这样每个人都可以构建自己的专属指令集, 哈哈当然我也在造数据集进行时~
2024-05-13 09:00:00 741
原创 解密Prompt系列4. 升级Instruction Tuning:Flan/T0/InstructGPT/TKInstruct
这一章我们聊聊指令微调,指令微调和前3章介绍的prompt有什么关系呢?哈哈只要你细品,你就会发现大家对prompt和instruction的定义存在些出入,部分认为instruction是prompt的子集,部分认为instruction是句子类型的prompt。
2024-05-13 07:45:00 923
原创 解密Prompt系列3. 冻结LM微调Prompt: Prefix-Tuning &Prompt-Tuning & P-Tuning
这一章我们介绍在下游任务微调中固定LM参数,只微调Prompt的相关模型。这类模型的优势很直观就是微调的参数量小,能大幅降低LLM的微调参数量,是轻量级的微调替代品。
2024-05-11 14:57:20 846
原创 解密Prompt系列2. 冻结Prompt微调LM: T5 & PET & LM-BFF
这一章我们介绍固定prompt微调LM的相关模型,他们的特点都是针对不同的下游任务设计不同的prompt模板,在微调过程中固定模板对预训练模型进行微调。
2024-05-11 14:56:23 732
原创 解密Prompt系列1. Tunning-Free Prompt:GPT3 & LAMA & AutoPrompt
解密Prompt系列1. Tunning-Free Prompt:GPT3 & LAMA & AutoPrompt
2024-05-11 14:55:08 846
原创 OpenAI 科学家:幻觉是大模型与生俱来的特性,而非缺陷
OpenAI 科学家 Andrej Karpathy 今早关于大模型幻觉的解释,观点惊人,掀起非常激烈的讨论。
2024-05-10 10:13:12 710
原创 大模型扫盲系列——初识大模型(文末大礼包)
近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析,帮助读者初步了解大模型。
2024-05-10 09:55:31 630
原创 【大模型书】从零开始大模型开发与微调:基于PyTorch与ChatGLM 入门必读
大模型是深度学习自然语言处理皇+冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。
2024-05-09 11:19:25 243
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人