自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1617)
  • 收藏
  • 关注

转载 李飞飞解读创业方向「空间智能」,让AI真正理解世界

来源:机器之心李飞飞创业选择的「空间智能」,完整的 TED 解读视频公布了。前段时间,路透社独家报道了知名「AI 教母」李飞飞正在创建一家初创公司,并完成了种子轮融资。在介绍这家初创公司时,一位消息人士引用了李飞飞在温哥华 TED 上的一次演讲,表示她在此次 TED 演讲中介绍了空间智能的概念。就在今天,李飞飞在 X 上放出了她在温哥华 TED 上的完整演讲视频。她在 X 上介绍称,「空间智能是人...

2024-05-21 14:30:15 1

转载 重大利好,通义千问疯狂降价!

降价后,1元最多=200万tokens!

2024-05-21 14:30:15 1

转载 谷歌2小时疯狂复仇,终极杀器硬刚GPT-4o!Gemini颠覆搜索,视频AI震破Sora

【导读】被OpenAI提前截胡的谷歌,今天不甘示弱地开启反击!大杀器Project Astra效果不输GPT-4o,文生视频模型Veo硬刚Sora,用AI彻底颠覆谷歌搜索,Gemini 1.5 Pro达到200万token上下文……谷歌轰出一连串武器,对OpenAI贴脸开大。谷歌I/O 2024如期来了,眼花缭乱地发布了一堆更新。跟OpenAI半小时的「小而美」发布会相比,谷歌显然准备得更加充分,...

2024-05-17 10:30:24 6

转载 CCF A类会议领域主席!国内Top2在职助理教授!硅谷大厂研发科学家!他们是怎么做到的?...

一对一腾讯会议咨询升学科研问题全搞定!CS Conference借助团队优势,我们与众多经平台验证真实性的学术新秀达成合作【如遇导师信息不实,十倍赔偿】,推出一对一腾讯会议咨询服务!其中不乏人工智能顶会领域主席、清北在职助理教授、北美四大博士博后、国内外一线大厂研究员等等,覆盖了人工智能、软件工程、体系结构、信息安全、数据挖掘图形学、交叉学科等众多领域,目前咨询好评率高达100%!部分导师的介绍和...

2024-05-16 08:00:49 5

转载 2折早鸟票最后三天|第四届稀土开发者大会与您相约北京!

第四届稀土开发者大会(2024 XDC)将于6月28日-6月29日在北京举办!本届大会精彩纷呈,以“代码不止 掘金不停”为主题。涵盖的专题广泛而深入,包括前端未来、大模型时代的云计算实践、架构设计和业务稳定性建设、GenAI 技术实践、AI Agent与应用创新、大模型工具链的应用与实践、大模型部署与推理、RAG与向量搜索、研发效能与团队管理和掘金创作者专场等。这些专题不仅展现了技术的最新发展,也...

2024-05-15 09:18:30 6

转载 思维链不存在了?纽约大学最新研究:推理步骤可「省略」

来源:新智元【导读】思维链技术,可能要被推翻了!来自纽约大学的最新研究表明:大模型并没有利用思维链的推理能力,它只是偷偷加了计算!红极一时的思维链技术,可能要被推翻了!还在惊讶于大模型居然能够利用思维链分步骤思考?还在苦于不会写思维链提示词?来自纽约大学的研究人员表示:「没关系的,都一样」,推理步骤不重要,不想写提示词也可以不写,用省略号代替就行了。论文地址:https://arxiv.org/p...

2024-05-14 18:49:35 5

转载 OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代...

梦晨 克雷西 发自 凹非寺来源 |量子位QbitAI不开玩笑,电影《她》真的来了。OpenAI最新旗舰大模型GPT-4o,不仅免费可用,能力更是横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。现场直播的效果更是炸裂:它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打断。GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思,接受文本、音频和图像的任意组合...

2024-05-14 18:49:35 11

转载 Meta最新进展!大模型“超级外挂”:LLM RAG

LLM RAG(Retrieval-Augmented Generation)是一种自然语言处理领域的模型架构,特别适用于生成式任务。它结合了检索和生成两种方法,旨在提高生成式任务的性能。RAG模型在2023年成为了基于LLM的系统中最流行的体系结构之一,并在多个应用领域中得到了广泛应用。我们邀请到了NLP & 多模态 & 语音处理人工智能博士.人工智能顶级会议AAAI、CVPR发...

2024-05-13 11:03:02 5

转载 史上最丑AI生图一夜爆火!又一款妙鸭级爆品来了?

来源:新智元【导读】最丑AI神器诞生,万物皆可黏土!全世界社交媒体上,网友们都为Remini疯狂了。无论是硅谷大佬,甄嬛传人物,还是地铁老爷爷看手机,没有人可以逃脱这场黏土变身。最近,网友们被一款传说中的最丑AI生图神器刷屏了。无论是表情包、网络梗图,还是热门电影,或是自家宠物,包括你想得到的和想不到的,都变成了粘土风格。地铁老爷爷看手机,忽然有了实体。《请回答1988》里这张佛系表情包,简直抓住...

2024-05-13 11:03:02 6

转载 万字长文总结大模型微调技能图谱

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等,几乎每天都有新的发展。我们总结了算法工程师需要掌握的大模型微调技能,并制作了大模型微调技能图谱,希望可以帮助大家将知识体系梳理清楚,为未来在大模型的工作与科研道路上节省时...

2024-05-08 10:01:17 15

转载 一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo

来源:机器之心开源大模型领域,又迎来一位强有力的竞争者。近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。项目地址:https://github.com/deepseek-ai/DeepSeek-V2论文标题:DeepSeek-V2: A Strong, Economical,...

2024-05-08 10:01:17 11

转载 AI教母李飞飞最终还是选择了创业!

来源:AI大模型实验室著名 AI 科学家、斯坦福大学教授李飞飞正式宣布创业,她成立了一家主要从事 “空间智能” 研发的公司,并且已经完成种子融资,投资方包括 a16z 和 Radical Ventures。查询坦福大学网站发现,李飞飞的个人介绍页面状态显示为:“2024 年 1 月 1 日至 2025 年 12 月 31 日,部分休假。”斯坦福大学李飞飞个人介绍页面:https://profile...

2024-05-06 19:53:48 15

转载 用扣子/Coze 揭秘吴恩达的4种 AI Agent 设计模式

来源:扣子Coze吴恩达教授在美国红杉 AI 活动上关于 Agent 的最新趋势与洞察,提出了目前有 4 种主要的 Agent 设计模式,分别是:Reflection:让 Agent 审视和修正自己生成的输出;Tool Use:LLM 生成代码、调用 API 等进行实际操作;Planning:让 Agent 分解复杂任务并按计划执行;Multiagent Collaboration:多个 Agen...

2024-05-06 19:53:48 52

转载 全面解析RLHF,PPO,DPO,Flash Attention,增量学习等大模型算法

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等,几乎每天都有新的发展。我们总结了算法工程师需要掌握的大模型微调技能,并制作了大模型微调技能图谱,希望可以帮助大家将知识体系梳理清楚,为未来在大模型的工作与科研道路上节省时...

2024-04-29 08:00:48 23

转载 GPT-5强到发指,Scaling Law依然有效!

来源:新智元【导读】奥特曼的斯坦福闭门演讲内容曝光了,可谓亮点频出:GPT-5会比GPT-4强得多,GPT-6还会更强;Scaling Law还未过时,我们远未达到这条曲线的顶端;谷歌用GPT-4复刻出Gemini很容易,但难的是新范式的创新。AI届大红人Altman在母校斯坦福开讲当天,在场的学生挤爆了英伟达礼堂。去礼堂路的上,人满为患,超1000人早早排在了门口。而整个礼堂,也是虚无坐席。就在...

2024-04-27 15:15:14 10

转载 清华团队国产“Sora”火了!画面效果对标OpenAI,长度可达16秒,还能读懂物理规律...

允中 发自 凹非寺来源 | 量子位QbitAISora席卷世界,也掀起了全球竞逐AI视频生成的热潮。就在今天,国内又有一支短片引发关注。视频来自生数科技联合清华大学最新发布的视频大模型「Vidu」。从官宣消息看,「Vidu」支持一键生成长达16秒、分辨率达1080p的高清视频内容。更令人惊喜的是,「Vidu」画面效果非常接近Sora,在多镜头语言、时间和空间一致性、遵循物理规律等方面表现都十分出...

2024-04-27 15:15:14 68

转载 Open-Sora全面开源升级:支持16s视频生成和720p分辨率

来源:机器之心Open-Sora 在开源社区悄悄更新了,现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。生成个横屏圣诞雪景,发b站再生成个竖屏,发抖音还能生成单镜头16秒的长视频,这下人人都能过把编剧瘾了怎么玩?指路GitHub:https://github.com/hpcai...

2024-04-25 16:10:36 19

转载 大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五

克雷西 发自 凹非寺来源 | 量子位QbitAI关于Llama 3,又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单,Llama 3位列第五,英文单项与GPT-4并列第一。不同于其他Benchmark,这份榜单的依据是模型一对一battle,由全网测评者自行命题并打分。最终,Llama 3取得了榜单中的第五名,排在前面的是GPT-4的三个不同版本,以及Claude 3超大...

2024-04-25 16:10:36 16

转载 一大堆中文版Llama3纷至沓来!

写在前面大家好,我是刘聪NLP。Llama3模型已经开源,可以就在这短短的两天之内,就出现了很多Chinese-Llama3 repo,开源社区也是相当的卷。再看到Llama3相关报告的时候,就预料到会有很多Chinese-Llama3,因为Llama3对中文十分不友好,15T Tokens的训练数据,仅有5%(750B Tokens)是其他语言,那么中文就更少了。当时还抖激灵,说先开个repo占...

2024-04-23 14:00:59 190

转载 【重磅!免费公开课】Llama 3技术剖析、微调、部署以及多模态训练

Meta公司推出了开源大语言模型Llama系列的最新产品—Llama 3,包含了80亿参数的Llama 3 8B和700亿参数的Llama 3 70B两个版本。Meta称其为“迄今为止最强的开源大模型”。Meta官方数据显示,Llama 3 8B模型在MMLU、GPQA、HumanEval等多项基准上均胜过同参数量级模型Gemma 7B和Mistral 7B Instruct,而70B模型则超越了...

2024-04-23 14:00:59 68

转载 北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token

鱼羊 发自 凹非寺来源 | 量子位QbitAI北大和字节联手搞了个大的:提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越Sora核心组件Diffusion Transformer(DiT)。并且代码开源,短短几天已经揽下1.3k标星,登上GitHub趋势榜。具体是个什么效果?实验数据上,这个名为VAR(Visual Autoregressive Modeling)的新方法...

2024-04-22 18:02:36 15

转载 大佬如何看待 Meta 发布 Llama3?

来源:知乎成诚(昆仑万维 AI Infra负责人)回答:Highlight:美中不足的是 LLaMa3 不会有 MoE 架构的模型,包括 400B+ 版本也是 Dense。其次 LLaMa3 也没有发布多模态版本的模型,甚至是 Early Access 的效果展示8B 模型吃 15T token 仍然有效,比 Mistral-7B 的 8T token 又翻了一倍 (最开始 Chinchilla ...

2024-04-20 19:23:37 66

转载 从今天起,人人都是AI开发者!

Robin 在 深圳来源 | 量子位QbitAI未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上发表“人人都是开发者”的主题演讲,他指出:AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。他表示,百度作为一家技...

2024-04-17 10:01:08 23

转载 藤校,G5名校导师计算机科研项目招生 | 发论文,拿推荐信的机会来啦

哈佛,MIT,耶鲁,剑桥,牛津...等排名top30的导师及各大学科顶会顶刊审稿人亲自领衔的『计算机科学一对一科研项目』终于全面开放如果你对上面的项目感兴趣请长按识别下方二维码添加顾问老师微信咨询并发送专属口令【人工智能与算法学习】即可领取专属报名优惠↓↓↓↓↓如果你对上面的项目感兴趣请长按识别下方二维码添加顾问老师微信咨询并发送专属口令【人工智能与算法学习】即可领取专属报名优惠↓↓↓↓↓盐趣开...

2024-04-17 10:01:08 15

转载 一文全面盘点算法工程师大模型微调技能图谱

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等,几乎每天都有新的发展。我们总结了算法工程师需要掌握的大模型微调技能,并制作了大模型微调技能图谱,希望可以帮助大家将知识体系梳理清楚,为未来在大模型的工作与科研道路上节省时...

2024-04-16 14:00:39 38

转载 多模态大语言模型综述

去年以来,我们见证了以 GPT-4V 为代表的多模态大语言模型(Multimodal Large Language Model,MLLM)的飞速发展。为此我们对综述进行了重大升级,帮助大家全面了解该领域的发展现状以及潜在的发展方向。MLLM 发展脉络图MLLM 脱胎于近年来广受关注的大语言模型(Large Language Model , LLM),在其原有的强大泛化和推理能力基础上,进一步引入了...

2024-04-15 22:06:12 58

转载 GPT-4V又被超越了一次,马斯克的首款多模态大模型来了!

来源:机器之心自从 2023 年 11 月 Grok 首次亮相以来,马斯克的 xAI 正在大模型领域不断取得进步,向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月,xAI 的首个多模态模型就问世了。昨天,xAI 推出了 Grok-1.5V,该模型不仅能理解文本,还能处理文档、图表、截图和照片中的内容。官方博文表示:「Grok-1.5V 在许多领域都能媲美当前顶尖的多模态模型,...

2024-04-15 22:06:12 32

转载 2023年图灵奖揭晓!史上首位数学和计算机最高奖“双料王”出现了!

白交 丰色 发自 凹非寺来源 | 量子位QbitAI刚刚,“计算机界最高荣誉”图灵奖揭晓——复杂性理论先驱、普林斯顿高等研究院教授艾维·维格森(Avi Wigderson)摘得。美国计算机协会(ACM)表示,表彰他对计算理论的基础性贡献,包括重塑人类对计算中随机性作用的理解,以及数十年来在理论计算机科学领域的领导地位。加上2021年获得的阿贝尔奖,维格森教授现在一举成为首个同时拿下数学和计算机最...

2024-04-11 18:16:44 53

转载 AI颠覆数学研究!菲尔兹奖得主、华裔数学家领衔11篇顶刊论文|陶哲轩转赞

【导读】毫无疑问,数学家的工作方式,正在被AI颠覆!陶哲轩转发的这期美国数学学会通报,大咖云集,星光璀璨。针对AI改变数学的议题,他们中有降临派,也有怀疑论者。而陶哲轩也直接高呼:这个领域太快了,现在我没发表的论文已经不够看了!AI,的确正在改变数学。最近,一直十分关注这个议题的陶哲轩,转发了最近一期的《美国数学学会通报》(Bulletin of the American Mathematical...

2024-04-11 18:16:44 25

转载 Mamba架构第一次做大!混合Transformer,打败Transformer

丰色 发自 凹非寺来源 | 量子位QbitAI精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。取两种架构之长,模型质量和效率兼得,要吞吐量有吞吐量,要低内存有低内存。初步跑分显示:Jamba性能总体接近Mixtral 8x-7B,处理128k长上下文时吞吐量却是其3倍。一共支持256k上下文,而单...

2024-04-08 14:50:46 40

转载 超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

来源:机器之心在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社区的极大关注,模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行,在准确性和延迟方面超越了 GPT-4,并将上下文长度减少了 95%。此外,Octopus v2 比 Llama7B + RAG 方案快...

2024-04-08 14:50:46 67

转载 大模型技术飞速发展,算法工程师岗位也要大洗牌了?

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等,几乎每天都有新的发展。作为算法工程师,面对如此飞快的技术迭代,是否感觉到自己的学习步伐有点跟不上技术的发展?而且对这些新兴技术的理解仅仅停留在应用层面上,实际上对背后的原理没有具体剖析过...

2024-04-07 14:30:38 24

转载 CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%

来源:新智元【导读】一年一度的CVPR 2024录用结果出炉了。今年,共有2719篇论文被接收,录用率为23.6%。CVPR 2024最终录用结果公布了!刚刚,CVPR官方发文称,今年共提交了11532份有效论文,2719篇论文被接收,录用率为23.6%。与去年相比,共有9155篇论文提交,2359篇论文接收,录用率降低2.2%。官方给的回复是,数据每年都会有波动的。据统计,CVPR的投稿量在20...

2024-04-07 14:30:38 114

转载 全球首个开源文生视频DiT

来源:机器之心随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。然而,由于视频数据的高度结构化与复杂性,如何将 DiT 扩展到视频生成领域却是一个挑战,来自上海人工智能实验室的研究团队联合其他机构通过大规模的实验回答了这个问题。早在去年 11 月,该团队就已经开源了一款...

2024-03-29 11:01:33 78

转载 开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有

来源:机器之心「太狂野了」。这是迄今为止最强大的开源大语言模型,超越了 Llama 2、Mistral 和马斯克刚刚开源的 Grok-1。本周三,大数据人工智能公司 Databricks 开源了通用大模型 DBRX,这是一款拥有 1320 亿参数的混合专家模型(MoE)。DBRX 的基础(DBRX Base)和微调(DBRX Instruct)版本已经在 GitHub 和 Hugging Face...

2024-03-28 22:16:52 91

转载 AI作曲家爆改周杰伦,华语乐坛一夜颠覆!Suno秒生爆款神曲,人人都成音乐家...

【导读】就在这几天,这款叫Suno AI的工具简直要一夜颠覆音乐圈。经它爆改的周董金曲,《以父之名》和《夜曲》直接封神。不懂乐理不懂作曲?没关系,从此人人都是音乐家!要疯了,Suno AI已经引起了音乐圈的大地震!人们纷纷惊呼:音乐人已死!外媒的描述是这样的——「可能席卷全世界的可怕AI音乐」。初创公司Suno AI,已经被公认为「音乐界的ChatGPT」。无人能否认它刮起的飓风。在官网上,Sun...

2024-03-28 22:16:52 86

转载 免费使用GPU算力,大模型部署轻松搞定!

活动时间2024年3月25日-4月15日活动内容1、免费试用:活动期间新用户开通试算即赠660元卡时GPU试算资源。A100 PCIE 40G、RTX 4090 24G、RTX 3090 24G等加速卡免费试用。2、充值有礼:活动期间完成账户充值的用户,根据充值金额兑换相应礼品。礼品兑换条件兑换说明小米魔方插头累计充值>5000元可兑换小米魔方插头一个。乐扣保温杯累计充值>30000元可兑换乐扣保...

2024-03-26 14:30:24 82

转载 全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂!

来源:新智元【导读】用不了多久,开源版的Sora就会涌来!理海大学微软团队已经做出一种全新多AI智能体框架Mora,可以完全复刻Sora能力,且生成视频效果几乎不相上下。微软版Sora诞生了!Sora虽爆火但闭源,给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出了Diffusion Transformer和空间patch策略,但想要达到Sora的性能还是很难,何...

2024-03-26 14:30:24 40

转载 全面解析LoRA、QLoRA、RLHF,PPO,DPO,Flash Attention、增量学习等大模型算法

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等,几乎每天都有新的发展。作为算法工程师,面对如此飞快的技术迭代,是否感觉到自己的学习步伐有点跟不上技术的发展?而且对这些新兴技术的理解仅仅停留在应用层面上,实际上对背后的原理没有具体剖析过...

2024-03-19 14:30:38 69

转载 2024年,大模型这些方向再次卷疯了!

2024年,大模型再次卷疯了!就在今日,Anthropic发布的Claude 3系列模型,已经实现了对最新大模型的全面超越。大模型(LLMs)是一种人工智能模型,旨在理解和生成人类语言。大模型通过在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。为了更好地让大家了解大模型时下爆火热点并抓住机遇,我们邀请顶会审稿人/workshop、高效教授/博导、大厂算法研究员等大...

2024-03-18 14:30:13 59

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除