- 博客(1377)
- 收藏
- 关注
转载 调教LLaMA类模型没那么难,LoRA将模型微调缩减到几小时
来源:机器之心作者:Sebastian RaschkaLoRA 微调方法,随着大模型的出现而走红。最近几个月,ChatGPT 等一系列大语言模型(LLM)相继出现,随之而来的是算力紧缺日益严重。虽然人人都想打造专属于自己的大模型,但是能负担得起上亿参数模型训练的机构却寥寥无几。在快速发展的人工智能领域,以高效和有效的方式使用大型语言模型正变得越来越重要。LoRA(Low-Rank Adaption...
2023-05-28 10:43:49
2
转载 IEEE IS评选AI十大新星,9位华人获奖!
来源:新智元【导读】华人群体已成人工智能领域的顶尖力量!最近人工智能领域著名杂志 IEEE Intelligent Systems公布了 2022 年度「人工智能十大新星」(AI's 10 to Watch)名单 ,其中有九位都是华人研究者。评选委员会由2名华人、5名非华人组成,从30多位提名竞争者中,根据科研质量、声誉、影响以及博士毕业以来的专家认可度,通过电子邮件和现场会议进行的多轮讨论后最终...
2023-05-28 10:43:49
5
转载 得分逼近ChatGPT,人类难以分辨!开源「原驼」爆火,iPhone都能微调大模型了
梦晨 发自 凹非寺来源 |量子位QbitAI自动测试分数达到ChatGPT的99.3%,人类难以分辨两者的回答……这是开源大模型最新成果,来自羊驼家族的又一重磅成员——华盛顿大学原驼(Guanaco)。更关键的是,与原驼一起提出的新方法QLoRA把微调大模型的显存需求从>780GB降低到<48GB。开源社区直接开始狂欢,相关论文成为24小时内关注度最高的AI论文。以Meta的美洲驼...
2023-05-25 20:31:38
13
转载 大模型部署的方案
借着热点,简单聊聊大模型的部署方案,作为一个只搞过CV部署的算法工程师,在最近LLM逐渐改变生活的大背景下,猛然意识到LLM部署也是很重要的。大模型很火,而且确实有用(很多垂类场景可以针对去训练),并且和Vision结合的大模型也逐渐多了起来。所以怎么部署大模型是一个超级重要的工程问题,很多公司也在紧锣密鼓的搞着。目前效果最好讨论最多的开源实现就是LLAMA,所以我这里讨论的也是基于LLAMA的...
2023-05-25 20:31:38
5
转载 让GAN再次伟大!拖一拖关键点效果让人惊艳,汤晓鸥弟子的DragGAN爆火!
丰色 萧箫 发自 凹非寺来源|量子位这两天,一段AI修图视频在国内外社交媒体上传疯了。不仅直接蹿升B站关键词联想搜索第一,视频播放上百万,微博推特也是火得一塌糊涂,转发者纷纷直呼“PS已死”。怎么回事?原来,现在P图真的只需要“轻轻点两下”,AI就能彻底理解你的想法!小到竖起狗子的耳朵:大到让整只狗子蹲下来,甚至让马岔开腿“跑跑步”,都只需要设置一个起始点和结束点,外加拽一拽就能搞定:不止是动...
2023-05-22 18:53:19
38
转载 GPT-4推理提升1750%!姚班校友提出全新「思维树ToT」框架,让LLM反复思考
来源:新智元【导读】由普林斯顿和谷歌DeepMind联合提出的全新「思维树」框架,让GPT-4可以自己提案、评估和决策,推理能力最高可提升1750%。2022年,前谷歌大脑华人科学家Jason Wei在一篇思维链的开山之作中首次提出,CoT可以增强LLM的推理能力。但即便有了思维链,LLM有时也会在非常简单的问题上犯错。最近,来自普林斯顿大学和Google DeepMind研究人员提出了一种全新的...
2023-05-22 18:53:19
10
转载 第一篇论文太难了。。。
当代研究生内卷现状——每天在实验室熬到半夜鸡叫,but,该有的实验数据一个也没得。为了准备组会前一天呕心沥血搞ppt,but,老师的一句论文进度怎么样,瞬间颤抖。那个总是抓住空隙打游戏的学弟发了一篇一作二区,but,身为师哥还没有任何大作……而今,论文也开始卷起来了——还在为读不懂论文而头痛,就听说隔壁寝室的小A发了一篇SCI?!你甚至不清楚本专业可以发哪些期刊和会议,隔壁的学霸已经因为发了论文国...
2023-05-15 17:30:48
24
转载 AI全栈代码下载 | YOLO系列/车道线/3D目标检测+改进/量化/蒸馏/剪枝/TensorRT
大家好,我是Leo,今天和大家介绍和推荐一下【集智书童】知识星球学习社区,这里不仅仅适用于初学者的基础学习,同时也适合已经工作了的AI算法工程师进行AI全栈技术体系的进阶。【集智书童】学习社区主要包含以下几个大的模块:1、YOLO全栈最全体系学习目标检测可以说是目前落地最为广泛的AI技术,比如行人检索、车辆检索、多目标跟踪、自动驾驶中的通用障碍物检测、行人检测、交通标识牌检测、车辆检测等等,都是以...
2023-05-12 20:16:39
17
转载 十分钟读懂Stable Diffusion运行原理
作者:symonAIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊艳其出色表现,也不禁好奇其背后技术。本文整理了一些学习过程中记录的技术内容,主要包括 Stable Diffusion 技术运行机制,希望...
2023-05-12 20:16:39
191
转载 谷歌一雪前耻!全新PaLM 2反超GPT-4,办公全家桶炸裂升级,Bard史诗进化
来源:新智元【导读】新版PaLM 2超强进化,办公全家桶Workspace全面升级,Bard全面增强、所有人可用……可以看出,这届I/O大会,谷歌是真的憋出不少大招。谷歌I/O 2023大会,仿佛又给谷歌的支持者们打了一针强心剂。此前,因为微软和OpenAI的优异表现,谷歌已经被唱衰了很久。但是,毕竟是做出了众多奠基性工作的AI老牌公司,谷歌这一轮的发力,让我们精神一振——它只是慢了,并不是噶了。...
2023-05-11 09:58:51
35
转载 图与代码不一致,Transformer论文被发现错误,网友:早该被指出1000次
来源:机器之心论文中的图有时会出现与实现代码不对应的情况,这会让读者头大,不知是有意还是无意为之。这次,没想到大名鼎鼎的 Transformer 论文也「翻车」了。2017 年,谷歌大脑团队在其论文《Attention Is All You Need》中创造性的提出 Transformer 这一架构,自此这一研究一路开挂,成为当今 NLP 领域最受欢迎的模型之一,被广泛应用于各种语言任务,并取得了...
2023-05-11 09:58:51
14
转载 利用大语言模型做多模态任务
作者:胡安文(人大在读 多模态、NLP)大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口并且不会透露任何模型上技术细节。因此,现阶段,如何利用LLM做一些多模态任务还是有一定的研究价值的。本文整理了近两年来基于LLM做vision-lanuage任...
2023-05-09 12:05:53
10
转载 AI大佬们都收藏的社群,不看后悔一辈子!
在信息爆炸的时代,我们获取信息的渠道得到了极大的丰富,但与此同时,如何快速获取自己所需要的高质量信息变得十分关键。在这样的一个大浪潮下,我们更应该自动的去适应和拥抱这一变化,下面给大家分享几个值得大家置顶、收藏的算法学习公众号,各个干货满满,值得关注。视学算法号主为中国科学院博士,先后在阿里、华为、美团、微软亚洲研究院科研踩过坑。公众号专注于人工智能 | 自然语言处理 | 计算机视觉前沿研究分享。...
2023-05-09 12:05:53
22
转载 分割之后再识别对象之间关系,新模型RAM为SAM赋予新技能
来源:机器之心本月初,Meta 推出的「分割一切(Segment Anything Model,SAM)」模型引起了广泛的关注。最近,来自南洋理工大学 MMLab团队、伦敦国王学院和同济大学VisCom 实验室的研究者们联合推出了一款名为 「Relate-Anything-Model(RAM)」的新模型。RAM 模型赋予了 Segment Anything Model(SAM)识别不同视觉概念...
2023-05-04 09:09:09
24
转载 自动驾驶求职必看!
有备无患!2024求职提前准备从上海车展回来,见识到了各大车厂竞争的惨烈,新车和更完备的智能驾驶方案都是先人一步的核心竞争力,而智能驾驶人才也自然成为争夺的关键。2023年自动驾驶进入量产快车道,企业渴望校招就能找到有行业相关经验,可以快速上手干活的人。这对2023校招求职者有了更高的要求,”三无“(无paper,无竞赛,无实习)同学求职会更加困难。找工作,不容易!找核心开发岗,非常不容易!找核心...
2023-04-30 20:03:05
34
转载 吴恩达教你如何玩转ChatGPT,限时免费!
克雷西 发自 凹非寺来源 |量子位QbitAIChatGPT催生新职业提示工程师,年薪可高达几十万美元。但是,该怎么入门?吴恩达面向广大开发者推出ChatGPT提示工程课程,与OpenAI合作出品。限时免费,而且对新手友好!课程发布还不到十个小时,就有网友表示已经学完了:还有网友表示没看够,期待推出更多内容:所谓提示工程,简单地说就是向大语言模型(LLM)发布有效的指令。在这段时长一个半小...
2023-04-29 12:59:52
23
转载 写给开发同学AI强化学习入门指南
该篇文章是我学习过程的一些归纳总结,如有不对希望能和大家多多交流,希望本篇文章对大家有所帮助最近因为 AI 大火,搞的我也对 AI 突然也很感兴趣,于是开启了 AI 的学习之旅。其实我也没学过机器学习,对 AI 基本上一窍不通,但是好在身处在这个信息爆炸的时代,去网上随便一搜发现大把的学习资料。像这个链接里面:https://github.com/ty4z2008/Qix/blob/master/...
2023-04-29 12:59:52
44
转载 YOLOv3-v8改进+量化+蒸馏+剪枝+TensorRT代码实践下载
大家好,我是Leo,今天和大家介绍和推荐一下【集智书童】知识星球学习社区,这里不仅仅适用于初学者的基础学习,同时也适合工程师进行全栈技术体系的构建。主要包含以下几个大的模块:1、YOLO全栈最全体系学习目标检测可以说是大多数AI落地项目基础,比如行人检索、车辆检索、多目标跟踪、自动驾驶、行人检测、交通标识牌检测、车辆检测等等,都是检测作为基础的项目,而关于目标检测,YOLO系列不管是速度还是精度可...
2023-04-25 13:42:58
35
转载 一次性分割一切,比SAM更强!
来源:机器之心CV 领域已经卷到了一个新的高度。本月初,Meta 发布「分割一切」AI 模型 ——Segment Anything Model(SAM)。SAM 被认为是一个通用的图像分割基础模型,它学会了关于物体的一般概念,可以为任何图像或视频中的任何物体生成 mask,包括在训练过程中没有遇到过的物体和图像类型。这种「零样本迁移」的能力令人惊叹,甚至有人称 CV 领域迎来了「GPT-3 时刻」...
2023-04-25 13:42:58
26
转载 复旦团队大模型 MOSS 开源了,有哪些技术亮点值得关注?
来源:知乎孙天祥(AWS应用科学家)回答:新上传3个gptq量化版模型权重本回答新增对线区首先解释一下我们的MOSS版本,目前开源的版本我们称为MOSS 003,二月份公开邀请内测的版本为MOSS 002,一月份我们还有一个内部测试版本叫做OpenChat 001,这里正好简单介绍一下我们的历次迭代过程。OpenChat 001在去年ChatGPT问世后,国内NLP从业者受到冲击很大,当时没有ll...
2023-04-24 14:01:32
171
转载 OpenAI现场演示官方版AutoGPT!创作画画发推一条龙,自主调用外部应用完成任务...
丰色 明敏 发自 凹非寺来源|量子位QbitAIOpenAI官方AutoGPT,要来了!就在AutoGPT项目破10万Star之际,OpenAI也放出重磅炸弹,由联合创始人格雷格·布洛克曼(Greg Brockman)亲自现场演示了ChatGPT即将上线的新功能。比如要一张这样有氛围感的晚餐图片:不劳您亲自写提示词,它来:采纳ChatGPT推荐的菜谱之后,想要去买食材?直接一句话,买菜平台的...
2023-04-24 14:01:32
63
转载 YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8
最近,基于Transformer的端到端检测器(DETR)已经取得了显著的性能。然而,DETR的高计算成本问题尚未得到有效解决,这限制了它们的实际应用,并使它们无法充分利用无后处理的好处,如非最大值抑制(NMS)。本文首先分析了现代实时目标检测器中NMS对推理速度的影响,并建立了端到端的速度基准。为了避免NMS引起的推理延迟,作者提出了一种实时检测Transformer(RT-DETR),这是第一...
2023-04-20 18:45:43
97
转载 CV圈又炸了?小扎高调官宣DINOv2,分割检索无所不能,网友:Meta才是「Open」AI...
来源:新智元编辑:桃子 拉燕【导读】Meta在CV领域又放了个大的!自监督+无需微调,计算机视觉又要不存在了?继「分割一切」后,Meta再发DINOv2。这还是小扎亲自官宣,Meta在CV领域又一重量级开源项目。小扎也是高调表示,Meta一直致力于开源各种AI工具,而今天发布的DINOv2更是SOTA级别的模型。能在深度估计、语义分割、图像相似性比较等方面实现自监督训练。小扎表示,用这个模型...
2023-04-20 18:45:43
28
转载 MiniGPT-4 发布,代码模型开源了!
不知不觉,距 GPT-4 首次公开问世,已经过去一个月了。在这段时间,有不少人拿到了 GPT-4 API 权限,开通了 ChatGPT Plus,提前体验了 GPT-4 的能力。这些人无一例外,都被 GPT-4 强大的逻辑分析、统筹规划能力深深折服。无论是论文创作、编写代码、还是数据分析,GPT-4 都给出了令人惊艳的表现。不过,大家可别忘了,GPT-4 作为一个多模态大语言模型,它不仅能生成文字...
2023-04-17 22:56:24
189
转载 「ChatGPT最强竞品」爆火:不限量不要钱免注册!一手实测体验在此
金磊 丰色 发自 凹非寺来源 |量子位QbitAI家人们,终于!终于!免费、支持中文、无需注册、不用骚操作直接可用的类ChatGPT产品,它来了!(此等好事必须第一时间和家人们分享)毫不意外的,目前它的热度已经被炒到不行:而且已经有一波网友抢先体验了一番,铺天盖地的一致好评。例如微博博主“Simon_阿文”就给出了这样的评价:是我目前为止试过最舒服的中文聊天体验。没错,它,就是“ChatGPT...
2023-04-16 13:34:06
90
转载 终结扩散模型:OpenAI开源新模型代码,一步成图,1秒18张
扩散模型的时代结束了。在 AI 画图的领域,人们一直关注的是扩散模型,人们一直在尝试不断改进,推出了 Stable Diffusion、Midjourney、DALL-E 等技术,并在其基础上构建应用。不过最近,OpenAI 提出的全新生成模型看起来要让这一领域经历一场革命。与高调推出 ChatGPT 、GPT-4 不同,这次 OpenAI 在上个月偷偷上传了一篇论文《 Consistency M...
2023-04-16 13:34:06
74
转载 AutoGPT太火了,无需人类插手自主完成任务,GitHub2.7万星
来源:机器之心OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。近日,AI 界貌似出现了一种新的趋势:自主人工智能。这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI 总监、刚刚回归 OpenAI 的 Andrej Karpathy 也为其大力宣传,并在推特赞扬:「AutoGPT 是 promp...
2023-04-14 13:53:06
49
转载 算法大咖都在默默收藏的9个公众号,越早知道越好!
ChatGPT的出现让人们对于AI人工智能的质疑戛然而止!人们惊奇的发现,以ChatGPT为代表的,基于人工智能生产内容技术(AIGC)的创新产品在内容创作、影视、绘画、办公等方面可以替代甚至超过大部门“新手”。ChatGPT的强大是源于其背后强大的算力支撑,以及和数以亿计的庞大训练模型数据。俗话说:逆水行舟,不进则退!在这样的一个大浪潮下,我们更应该自动的去适应和拥抱这一变化,下面给大家分享9个...
2023-04-14 13:53:06
37
转载 最强Zero-Shot视觉应用:Grounding DINO+Segment Anything+Stable Diffusion
借着Meta发布的Segment Anything视觉大模型,跟朋友们做了一个最强Zero-Shot视觉应用:最强的Zero-Shot检测器,最强的Zero-Shot分割器,最强的Zero-Shot生成器,三合一模型简称为Grounded-SAM。代码地址如下:https://github.com/IDEA-Research/Grounded-Segment-Anything三种类型的模型可以分开...
2023-04-10 17:19:17
340
转载 必看!大语言模型调研汇总!!
作者:guolipa @知乎 自从ChatGPT出现之后,各种大语言模型是彻底被解封了,每天见到的模型都能不重样,几乎分不清这些模型是哪个机构发布的、有什么功能特点、以及这些模型的关系。比如 GPT-3.0 和 GPT 3.5 就有一系列的模型版本和索引,还有羊驼、小羊驼、骆驼 ......动图封面于是浅浅的调研了一下比较有名的大语言模型,主要是想混个脸熟,整理完之后就感觉清晰多了,又可以轻...
2023-04-10 17:19:17
565
转载 从中专生到博士后!她的励志故事“热血又感人”
“当一次又一次遇到挫折时,我从未放弃自己的梦想。”近日,在河南职业技术学院开学典礼上,教师魏晓娟分享了自己的故事。她求学26载,从一名中专生逆袭为博士后,从深山里干农活的小姑娘,成长为河南职业技术学院人工智能教研室的教师。网友纷纷点赞:热血又感人!魏晓娟出生于河南的一个小村庄,爷爷告诉她:“上学出息了,就能走出大山。”小学离家远,魏晓娟每周回一次家,稚嫩的双脚爬坡翻山,从不喊苦。初中毕业后,由于家...
2023-04-06 18:39:02
39
转载 Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式
来源:新智元【导读】今天,Meta发布史上首个图像分割基础模型SAM,将NLP领域的prompt范式引进CV,让模型可以通过prompt一键抠图。网友直呼:CV不存在了!就在刚刚,Meta AI发布了Segment Anything Model(SAM)——第一个图像分割基础模型。SAM能从照片或视频中对任意对象实现一键分割,并且能够零样本迁移到其他任务。整体而言,SAM遵循了基础模型的思路:1....
2023-04-06 18:39:02
24
转载 实测MidJourney,效果惊艳世人!
丰色 发自 凹非寺来源 |量子位QbitAI这两天,不少人开始拿到Adobe Firefly的测试资格。虽然3月下旬才刚刚杀入,但作为设计界权威公司的新AI工具,它的生成效果也自是被寄予厚望。这不,英伟达AI研究科学家Jim Fan率先给出实测:Adobe能否与自筹资金的11 人团队MidJourney相抗衡?结果是——嗯,Adobe Firefly被吊打了……不信你看:Adobe Firef...
2023-04-06 18:39:02
890
转载 风靡27年,这本经典巨著YYDS!(文末赠书)
这本被称为“人工智能领域标准教科书”的《人工智能:现代方法》就无愧于“巨著”这两个字。这是一本在全球范围内享有盛誉,134个国家或地区的1500多所高校高度认可的,被公认为是“人工智能领域最好的”教科书。伴随着人工智能的爆炸式发展,《人工智能:现代方法》始终站在领域的前沿,不断推出新版本,常年稳居各大榜单前列,豆瓣9分美亚4.6分!在时间长河的磨砺中,它被全球上千所高校奉为圭臬,已然铸成今日的经典...
2023-03-31 18:23:41
74
转载 动动嘴,就能帮你生成代码!焕然一新的代码编辑器:GitHub Copilot X,来了!
上周五,微软给 Office 全家桶都加上了 GPT-4 的功能,并带来了焕然一新的产品 Microsoft 365 Copilot。而作为最早一个吃螃蟹的 GitHub Copilot,又怎能在这次浪潮中少了它的身影呢。今天,它终于来了。昨天晚上,GitHub 官方发推宣布,一款基于 AI 驱动的、跨时代代码编辑器 GitHub Copilot X 横空出世,将为开发者带来前所未有的编程体验!已...
2023-03-27 18:03:31
177
转载 GPT-4写代码能力提升21%!MIT新方法让LLM学会反思,网友:和人类的思考方式一样...
Pine 发自 凹非寺来源 |量子位QbitAIGPT-4再度进化!加上一个简单方法,就能让GPT-4这类大语言模型学会自我反思,性能直接提升30%。在此之前,大语言模型回答出错,经常是二话不说,直接先道歉,然后emmmmmm,继续乱猜。现在,它不会这样了,有了新方法的加成,GPT-4不仅会反思自己哪里错了,还会给出改进策略。比如说它会自动分析为什么“陷入循环”:或者说反思一下自己有缺陷的搜索...
2023-03-27 18:03:31
21
转载 YOLO系列的演进,从v1到v7(一)
来源:AI公园作者:Maxim Ivanov编译:ronghuaiyang导读经典再回顾,本文介绍v1到v3。如果你需要速度快的目标检测器,那么 YOLO 系列的神经网络模型实际上是当今的标准。解决检测问题还有很多其他优秀的模型,但我们不会在这篇综述中涉及它们。目前,已经写了相当多的文章来分析 YOLO 各个版本的功能。本文的目的是对整个家族进行比较分析。我们想看看架构的演变,这样我们就可以更好地...
2023-03-23 16:55:50
112
转载 OpenAI 发布 GPT-4,有哪些技术上的优化或突破?
作者:张俊林在这个历史性的时刻,回答个问题,留下自己作为历史见证人的足迹。GPT4的技术报告里很明确地指出了三个新的方向:第一,LLM最前沿研究的封闭化或小圈子化。技术报告里说了,出于竞争以及安全等方面的考虑,未公布模型规模等技术细节。从GPT 2.0的开源,到GPT 3.0的只有论文,再到ChatGPT连论文也没有,直到GPT 4.0的技术报告更像效果评测报告。一个很明显的趋势是,OpenAI做...
2023-03-23 16:55:50
103
转载 面向GPT-4编程的时代来了:GitHub Copilot大升级,首次集成聊天功能
来源:机器之心编辑:蛋酱从今天开始,面向 GPT-4 编程。面向 GPT-4 编程,程序员们终于等到了这一天。作为 Copilot 代码补全工具的升级,GitHub 刚刚宣布了 Copilot X 计划,正式接入 GPT-4,并放出了一系列全新功能。Copilot X 搭建了一种以代码为中心的聊天模式。升级后的 Copilot 在整个开发生命周期中均可应用,而不仅仅是代码补全。通过整合聊天和语音功...
2023-03-23 16:55:50
141
转载 励志小哥抢先搞定GPT读图功能,单卡就能实现新SOTA,代码已开源|CVPR2023
Pine 发自 凹非寺来源 |量子位QbitAI能读图的GPT-4震撼发布了!但要用它还得排队。。。不如先试试这个~加上一个小模型,就能让ChatGPT、GPT-3这类目前只能理解文本的大语言模型轻松读图,各种刁钻的细节问题都能手拿把掐。并且训练这个小模型单卡(一块RTX 3090)就能搞定。效果呢,直接看图。比如说,给训练后的GPT-3输入一张“音乐现场”的图片,问它:现场在举办什么活动?毫...
2023-03-19 22:00:50
93
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人