自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1441)
  • 收藏
  • 关注

转载 大模型这么搞也能中A会论文

如果你的导师属于第一个课题就让你自己找,没钱,没资源,也没法做指导,唯一会的技能就是问进度的话!那么,你有idea(创新点)就发,别管水不水。没有idea,来研梦非凡!原始idea是重要的!写作表达也很重要。很多同学可能不知道idea是什么,做科研的流程有什么步骤,没有科研经历,导师和上面讲的一样,写论文也没可以手把手指点的人。来看研梦非凡的《论文写作指导课》,7节课带你从读论文⌈学会发现idea...

2024-02-20 11:57:42 42

转载 后Sora时代,CV从业者如何选择模型?卷积还是ViT,监督学习还是CLIP范式

本文来源 机器之心 编辑:蛋酱如何衡量一个视觉模型?又如何选择适合自己需求的视觉模型?MBZUAI和Meta的研究者给出了答案。一直以来,ImageNet 准确率是评估模型性能的主要指标,也是它最初点燃了深度学习革命的火种。但对于今天的计算视觉领域来说,这一指标正变得越来越不「够用」。因为计算机视觉模型已变得越来越复杂,从早期的 ConvNets 到 Vision Transformers,可用...

2024-02-19 11:05:01 29

转载 卡耐基梅隆、帝国理工导师计算机方向科研项目招生开启,发论文的机会来了!...

来自全球顶级名校的学术大牛首度云集一方哈佛,MIT,耶鲁,剑桥,牛津...等排名top30的导师及各大学科顶会顶刊审稿人亲自领衔的『计算机科学一对一科研项目』终于全面开放计算机科学Top名校学术大咖一对一科研项目详细信息如果你对上面的项目感兴趣请长按识别下方二维码添加顾问老师微信咨询并发送专属口令【机器学习与AI生成创作】即可领取专属报名优惠↓↓↓↓↓*专属优惠有效期为咨询之日起15天内...

2024-02-19 11:05:01 29

原创 ICCV 2023 | 虚拟试衣、可控人像生成,5篇论文看扩散模型diffusion应用

虚拟试衣、人像生成相关论文1、DiffCloth: Diffusion Based Garment Synthesis and Manipulation via Structural Cross-modal Semantic Alignment跨模态的服装合成和操作,极大改善设计师通过灵活的语言界面生成服装和修改设计的方式。然而,尽管用扩散模型在通用图像生成方面取得显著进展,但是生成与输入的文本提...

2024-02-18 20:12:04 1085

转载 转发扩散急招 | 算法/开发/产品/运营/商务,各类岗位均有,base广州/北京/武汉/深圳...

长按或扫一扫下面二维码,搜索心仪岗位,投递简历、即可完成内推!专属内推二维码,先人一步、需要状态跟踪,可后台留言!

2024-02-18 20:12:04 26

转载 AI也造代码屎山!研究发现GitHub Copilot代码可维护性差,偏爱“无脑重写”而非重构复用已有代码...

文章来源 量子位AI帮忙写代码程序员用了都说好,但代码质量真的靠谱吗?结果或许令你大跌眼镜。一家名为GitClear的公司分析了近四年超过1.5亿行代码后发现,随着GitHub Copilot工具的加入,代码流失率(即代码写入后不久又被返工修改、删除的情况)出现了显著上升:2023年为7.1%,而2020年时仅为3.3%,翻了一番。与之相应的,代码复用率也出现了明显下降。言外之意,AI写的很多内...

2024-02-14 13:17:19 70

原创 ICCV 2023 | 8篇论文看扩散模型diffusion用于图像检测任务:动作检测、目标检测、异常检测、deepfake检测...

1、动作检测 DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion基于扩散方法提出一种新的时序动作检测(TAD)算法,简称DiffTAD。以随机时序proposals作为输入,可以在未修剪的长视频中准确生成动作proposals。从生成建模的视角,与先前的判别学习方法不同。首先将真实proposals从正向扩散到随...

2024-02-08 09:19:12 1959

转载 AIGC教育行业全景报告:AI助教和家教成真,学习机迎来新机遇

文章转自 量子位经过一年的快速迭代,业内对于生成式AI将会率先落地于哪些行业已经有了答案。教育领域,不仅被OpenAI列为重点应用之一,也成为国内大模型厂商布局的重点方向。生成式AI技术发展的背后,反映出人类与大模型交互的不断精进。大模型在训练过程中不断学习人类的思考方式,人类在与大模型的对话中也收获了灵感和新知。这一过程,正是「教学相长」,也是教育追求的理想状态。正是因为生成式AI与教育的高度适...

2024-02-07 12:07:22 61

转载 从入门到实战,32节时间序列实战课!

时间序列的出现是为了解决带有时间戳,并考虑了数据点之间的时间相关性的数据,相信大家在学习时序中遇到了不少的难点。所以这次我在原来的30节时间序列系列课程基础上,又更新了两节时序前沿课,课程分为五个模块。模块一基础:认识数据科学家模块二进阶:时间序列预测概论+论文和代码讲解模块三项目实战:基于股价和零售的时序项目实战模块四比赛实战:数据科学入门赛+回答准确性预测赛模块五时序前沿:前沿机器学习与时序+...

2024-02-07 12:07:22 45

转载 年终汇总​!ICLR24、AAAI24、CVPR23、NIPS23、ICML23、ACL23论文合集

ICLR2024放榜后,年前的主要顶会的录用结果基本全部发布。我花了3个月的时间整理了包括AAAI2024、ICLR2024、CVPR 2023、ECCV 2023、ICML 2023、ICLR 2023、NeurIPS 2023、ACL 2023、EMNLP 2023、AAAI 2023、WWW 2023等顶会在内的超过20000篇人工智能优质论文,今天一次性分享给大家。为了方便大家阅读,我把各...

2024-02-05 13:21:08 153

转载 最新多模态生成模型 MM-Interleaved 开源

转自机器之心过去几个月中,随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出,「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目的焦点。想象一下,AI 不仅会聊天,还长了「眼睛」,能看懂图片,甚至还会通过画画来表达自己!这意味着,你可以和它们谈天说地,分享图片或视频,它们也同样能用图文并茂的方式回应你。最近,上海人工智能实验室联合香港中文大学多媒体实验室(MMLa...

2024-02-05 13:21:08 127

转载 超全合集!467篇医学图像论文PDF分享

最新的《医疗大数据和人工智能产业报告》中显示,人工智能医学图像已经走到行业最前端,成为人工智能交叉领域中最有热度的方向之一。针对所有人工智能医学图像的同学们,我打造了16节医学图像系列课程。涵盖基础课程与Kaggle比赛全程实战!此外还有AI医学2大顶刊、6大方向467篇论文以及AI+医学人均必看的201页电子书!添加顾问小享领取467篇论文+201页电子书如果你是刚入门的小白,课程里有医学图像分...

2024-02-04 11:53:05 44

转载 ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞

本文来源 新智元 编辑:桃子【新智元导读】当前的视觉模型哪个更好?Meta团队最新一波研究来了。如何根据特定需求选择视觉模型?ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较?来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。论文地址:https://arxiv.org/pdf/2311.09...

2024-02-04 11:53:05 32

原创 爆炸!最新150篇!2024年1月diffusion生成扩散模型论文汇总

001 (2024-02-1) Distilling Conditional Diffusion Models for Offline Reinforcement Learning through Trajectory Stitching https://arxiv.org/pdf/2402.00807.pdf002 (2024-02-1) AnimateLCM Accelerati...

2024-02-02 15:15:11 985

转载 应届60万年薪的大厂核心部门,看懂这本《互联网大厂推荐算法实战》你也能行!...

正文开始前,先派送福利扫码备注【送书】进群,参与免费寄送【互联网大厂推荐算法实战】图书抽奖活动,活动截止日期2024-02-02晚上10点。也可自行购买,戳如下,专属优惠!京东链接:Part.1做推荐算法在大厂有多吃香?小异最近听说一位做推荐算法的同学通过面试,顺利入职某大厂核心盈利部门,真是太羡慕他了。为什么会推荐算法就能在大厂这么吃香?因为大厂要依靠推荐系统来变现。例如,电商企业要向用户...

2024-01-31 20:29:59 47

转载 综述 | 多模态 LLM,大模型的未来

本文来源 机器之心编辑部多模态大型语言模型进展如何?盘点 26 个当前最佳多模态大型语言模型。当前 AI 领域的关注重心正从大型语言模型(LLM)向多模态转移,于是乎,让 LLM 具备多模态能力的多模态大型语言模型(MM-LLM)就成了一个备受关注的研究主题。近日,腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布了一份综述报告,全面梳理了 MM-LLM 的近期进展...

2024-01-31 20:29:59 250

转载 《Kaggle 2023年鉴》500条金牌方案分享

2023年,Kaggle共举办65场比赛,总奖金300万美金,共吸引了全球8万支队伍参加。如今,Kaggle是全球最顶级的权威性数据科学竞赛平台,以及全球最大的数据科学家社区。2024年,无论你需要求学申请还是工作就职,Kaggle都会是强有力的背书,让你拥有从其他竞争者中脱颖而出的优势。回顾去年,我整理了2023年10场比赛54个金牌方案,CV与NLP方向都有。此外,还有过去几年470场金牌方案...

2024-01-30 11:53:00 90

转载 多模态大模型新框架V*:「视觉搜索」来作为核心机制!

本文来源 新智元 编辑:桃子【新智元导读】多模态大模型GPT-4V也会「有眼无珠」。UC San Diego纽约大学研究人员提出全新V*视觉搜索算法逆转LLM弱视觉宿命。Sam Altman最近在世界经济论坛上发言,称达到人类级别的AI很快就会降临。但是,正如LeCun一直以来所言,如今的AI连猫狗都不如。现在看来的确如此。GPT-4V、LLaVA等多模态模型图像理解力足以让人惊叹。但是,它们...

2024-01-30 11:53:00 81

原创 ICCV 2023 | 9篇论文看扩散模型diffusion用于图像恢复任务:超分、恢复、增强、去模糊、去阴影...

1、HSR-Diff: Hyperspectral Image Super-Resolution via Conditional Diffusion Models尽管高光谱图像(hyperspectral image,HSIs)在执行各种计算机视觉任务中的重要性已被证明,但由于在空间域中具有低分辨率(LR)属性,其潜力受到不利影响,这是由多种物理因素引起的。受到深度生成模型最新进展的启发,提出一种...

2024-01-29 18:35:23 1309

转载 DreamDistribution:多变!根据 参照物 无限生成!

本文来源 新智元 编辑:LRS【新智元导读】将图片集反演到语义空间的分布,生成多样个性化图片或3D渲染,支持灵活文本编辑、多样性控制、概念混合等。最近,来自南加州大学、哈佛大学等机构的研究团队提出了一种全新的基于提示学习的方法——DreamDistribution。这种方法可以让任何基于文字提示的生成模型(比如文生图、文生3D等),通过一组参照图片来学习对应的视觉属性共性和变化的文本提示分布。论...

2024-01-26 11:54:01 448

转载 Llama 2打败GPT-4!Meta让大模型自我奖励自迭代,再证合成数据是LLM终局

正文开始前,先派送福利扫码备注【送书】进群,参与免费寄送【Llama大模型实践指南】大模型应用开发图书抽奖活动,活动截止日期2024-01-28晚上10点。也可自行购买,戳如下,专属 5折优惠!京东专属链接:本文源自:新智元 编辑:桃子 润【导读】AI训AI必将成为一大趋势。Meta和NYU团队提出让大模型「自我奖励」的方法,让Llama2一举击败GPT-4 0613、Claude 2...

2024-01-26 11:54:01 58

转载 500+份AIGC系列报告!AIGC行业全面掌握

2023年,AIGC和大模型产业井喷,推动AI加速渗透进百行千业,引发生产力与创造力革命。随着人工智能技术的不断升级与突破,生成式AI加速向文本、图像、音视频等领域渗透,预计于2025年带动相关的市场规模将达到7770亿元。AIGC的市场前景广阔,并且机遇巨大。这次我根据AIGC行业的发展轨迹及实践经验,整理了2023年AIGC年度发展报告580份和2023年AIGC论文合集130篇,希望为大家的...

2024-01-23 11:56:17 46

转载 找出“高能时刻”!AIGC内容理解 | 字节&中科院自动化所@AAAI 2024

转载自 梦晨 发自 凹非寺 量子位 大家看视频用过“高光时刻”功能吗?观众可以直接空降到精彩时刻,主播也可以从长时间直播录像中复盘自己的表现。字节跳动联合中科院自动化研究所提出新方法,用AI快速检测出视频中的高光片段,对输入视频的长度以及期望提取的高光长度都具有极高的灵活性,相关论文已被AAAI 2024收录。基于原型学习的基准解决方案连续学习问题在图像识别领域得到了很好的发展,有效缓解了...

2024-01-23 11:56:17 52

原创 ICCV 2023 | 图像分割类扩散模型diffusion的 8 篇论文

1、DDP: Diffusion Model for Dense Visual Prediction提出一种简单、高效但功能强大的基于条件扩散流程(density visual predictions)的框架。方法采用“噪声到分割图”(noise-to-map)的生成范式进行预测,通过逐步从随机高斯分布中去除噪声来引导图像生成。这种方法称为DDP,无需特定于任务的设计和架构定制,易于推广到大多数密...

2024-01-22 11:53:21 1204

转载 五问:清华毕业生去哪了? | 转载

本文转载来源 清华大学近日,清华就业工作会召开清华2023届档案在校本科毕业生3200多人档案在校研究生毕业生5200多人这些清华学生毕业后都去哪了?就业还是深造?国内还是国外?让我们来看看具体数据一问就业还是深造?本科生选择继续深造的比例为80.8%硕士生选择继续深造的比例为12.8%本科生更多选择继续读书求学硕士生更多选择走上工作岗位二问清华毕业生“80%都出国了”?NO!本届毕业生出国(...

2024-01-18 11:53:22 45

转载 MoviePy:超强的 视频处理Python 库

作者:小小明https://xxmdmst.blog.csdn.net/article/details/134938026阅读本文档的前置说明:本文档用于讲解Python的moviepy库的自带函数的用法,主要目的是讲一下每个函数的每个参数的含义,无需一开始就全部掌握,粗略看一下就行,可以在后面自己开发过程,遇到不会用的函数再回过头来看看本文档,我将在后续的文章中,通过几下实际的案例来理解视频特效...

2024-01-18 11:53:22 319

转载 万物替换Replace Anything:高质量图像目标替换编辑方法,demo可试玩,期待开源...

本文来源 白交 发自 凹非寺 量子位Replace Anything as you want。现在只需框住你需要保留的区域,AI就可以替换万物了!比如让霉霉穿上中国旗袍,结果发饰、服装、背景等各种细节全都替换掉了。马斯克变身厨子……这是阿里智能计算研究院提出的ReplaceAnything。继Animate Anyone之后,阿里新框架再次引爆社区。除此之外,它可以让羽绒服的小哥、正在背书包的...

2024-01-16 11:57:33 269

转载 100+目标检测必备论文,建议收藏!

目标检测是CV领域最广的一个算法。本文整理了三大顶会CVPR、ECCV、ICCV中85篇目标检测论文与代码;系统梳理YOLOv1-YOLOv8论文及代码;12大必备YOLO项目;以及20条常用小样本目标检测方法汇总。合集下载地址在下文二维码。85篇顶会论文与代码目标检测顶会热门研究可分为3D目标检测、视频目标检测、异常检测等17个细分领域。相关85篇论文及代码已经整理完毕,大家可以扫码下载。长按二...

2024-01-16 11:57:33 38

原创 ICCV 2023 | 巡礼10篇论文,看扩散模型diffusion的可控生成

1、Adding Conditional Control to Text-to-Image Diffusion Models经典再回顾!ICCV 2023最佳论文ControlNet,用于向大型预训练的文本到图像扩散模型添加空间条件控制。ControlNet锁定了就绪的大型扩散模型,并重用它们深层和稳健的编码层,这些层已经通过数十亿张图像进行了预训练,作为学习多样的条件控制的强大支撑。神经架构与“...

2024-01-15 19:41:37 998

转载 希望早日开源!谷歌提出Instruct-Imagen:多模态指令的图像生成

本文来源 机器之心 编辑:Panda用图 2 的风格画图 1 的猫猫并给它戴上一顶帽子。谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术,多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像,效果堪比 PS 大神抓着你的手助你 P 图。在使用大型语言模型(LLM)时,我们都已经见证过了指令微调的重要性。如果应用得当,通过指令微调,我们能让 LLM 帮助我们完成各...

2024-01-12 13:25:01 107

原创 ICCV 2023 | 从14篇论文看如何 改进扩散模型diffusion ?

1、Discriminative Class Tokens for Text-to-Image Diffusion Models文本到图像扩散模型,使得生成多样且高质量的图像成为可能。然而,这些图像往往在描绘细节方面不够精细,并且容易出现由于输入文本的歧义导致的错误。缓解这些问题的一种方法是在带类标签的数据集上训练扩散模型。这种方法有两个缺点:(i)监督数据集通常与大规模抓取的文本-图像数据集相比...

2024-01-10 11:57:32 1010

转载 开源 | 视频片段定位 TSG:一句话精准视频片段定位,清华新SOTA

本文来源 陈厚伦 投稿 量子位只需一句话描述,就能在一大段视频中定位到对应片段!比如描述“一个人一边下楼梯一边喝水”,通过视频画面和脚步声的匹配,新方法一下子就能揪出对应起止时间戳:就连“大笑”这种语义难理解型的,也能准确定位:方法名为自适应双分支促进网络(ADPN),由清华大学研究团队提出。具体来说,ADPN是用来完成一个叫做视频片段定位(Temporal Sentence Grounding...

2024-01-08 11:56:33 116

转载 30节AI大模型系列课 | 手把手带你从入门到实战

2023年大西洋彼岸的OpenAi公司,首次向世界吹响「大模型主导未来世界变革」的号角。国内科技公司也加入了这场AI变革,从百度的「文心一言」、阿里巴巴的「通义千问」、华为的「盘古大模型」,阿里巴巴的「通义千问」等,世界正在被科技语言,不断的刷新与迭代,目前,人类已经来到由「有理有表的语言训练」为核心的大模型时间。AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,这次我特意复盘和整理大模型学...

2024-01-08 11:56:33 538

转载 MobileVLM:移动端多模态大模型!骁龙888实时运行 | 美团、浙大等

本文来源 机器之心编辑部大模型涌向移动端的浪潮愈演愈烈,终于有人把多模态大模型也搬到了移动端上。近日,美团、浙大等推出了能够在移动端部署的多模态大模型,包含了 LLM 基座训练、SFT、VLM 全流程。也许不久的将来,每个人都能方便、快捷、低成本的拥有属于自己的大模型。MobileVLM 是一款专为移动设备设计的快速、强大和开放的视觉语言助手。它结合了面向移动设备的架构设计和技术,包括从头开始训...

2024-01-06 08:24:39 191

原创 ICCV 2023 视频AIGC(编辑/生成/转换)论文 7 篇

1、Pix2Video: Video Editing using Image Diffusion基于大规模图像库训练的图像扩散模型已成为质量和多样性方面最为通用的图像生成模型。它们支持反转真实图像和条件生成(例如,文本生成),使其在高质量图像编辑应用中具有吸引力。本文研究如何利用这些预训练的图像模型进行文本引导的视频编辑。关键挑战在于在保留源视频内容的同时实现目标编辑。方法分为两个简单的步骤:首先...

2024-01-06 08:24:39 1295

转载 新时代程序员必知必会!一文读懂LangChain框架,弥补大模型短板

正文开始前,先派送福利扫码备注【送书】进群,参与免费寄送【LANGCHAIN入门指南】大模型应用开发图书抽奖活动,活动截止日期2024-01-07晚上10点。也可自行购买,戳如下,专属 5折优惠!京东专属链接:2023年可以说是人工智能领域不平凡的一年,随着人工智能领域的飞速发展,开发者们都在寻找能够轻松、高效地构建应用的工具。尤其对于那些不熟悉大语言模型领域,或者初入此领域的开发者来说,...

2024-01-05 11:06:32 123

转载 大模型训练为什么用 A100 不用 4090

知乎作者:李博杰来源:https://zhuanlan.zhihu.com/p/655402388这是一个好问题。先说结论,大模型的训练用 4090 是不行的,但推理(inference/serving)用 4090 不仅可行,在性价比上还能比 H100 稍高。4090 如果极致优化,性价比甚至可以达到 H100 的 2 倍。事实上,H100/A100 和 4090 最大的区别就在通信和内存上,算...

2024-01-05 11:06:32 203

转载 Outfit Anyone:阿里 虚拟试衣 新技术,实现真人百变换装

本文来源 机器之心不实际试穿,就能尝试各种服饰,虚拟试衣技术让「QQ秀」升级成了真人版,为时尚行业打开了新世界的大门。然而,现有的虚拟试衣方法在逼真性和细节上的一致性方面还存在挑战。虽然扩散模型在创造高品质和真实感图像方面表现出众,但在虚拟试衣等特定场景中,它们在维持控制力和一致性方面还有待提高。Outfit Anyone 利用了一种创新的双流条件扩散模型,有效地解决了这些问题,能够精确地处理服...

2024-01-02 11:52:39 759 1

转载 FontDiffuser:基于扩散模型的字体生成

作者丨杨振华、彭德智 编辑丨极市平台来源丨华南理工大学DLVC实验室、阿里巴巴LOGO论文链接: https://arxiv.org/abs/2312.12142项目链接: https://yeungchenwa.github.io/fontdiffuser-homepage/HuggingFace Demo链接: https://huggingface.co/spaces/yeungche...

2024-01-01 17:57:31 193

原创 元旦在即!不是一杯奶茶喝不起,而是我T M直接用来跟进 AIGC+CV视觉 前沿技术,它不香?!...

元旦在即!【AI生成创作与计算机视觉】星球活动再起!不是 一杯奶茶 喝不起,而是我 T M 直接用来跟进 AIGC+CV视觉 前沿技术,它不更香?!【AI生成创作与计算机视觉】知识星球2022、2023年开始,基于扩散模型的AI绘画、ChatGPT系列大模型主导的AIGC狂潮已来!大模型下的科研、工业应用方向,已在重构进行中!计算机视觉、图像处理方向已迎来新一轮变革!AIGC将渗透到每一个细领域!...

2023-12-30 15:24:02 386

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除