• 博客(2105)
  • 收藏
  • 关注

原创 谷歌大型推理模型曝光!击败Claude-3.7-Thinking

对人类而言,孔→重力→漏水→零储存是瞬间完成的因果链,但模型需要从碎片化文本中重组逻辑:既要解析"密封另一端"是否指顶部(影响水流路径),又要过滤训练数据中可能存在的矛盾案例(如文学作品中"用破桶打水"的比喻)。就在最近,用户在Gemini悬浮窗中还意外发现“与Live共享屏幕”按钮,“误打误撞”发现了谷歌为Gemini Live推出的全新AI实时视频功能!我有一个 7 升的金属桶,底部有一个孔,另一端有一块金属板,用于密封。目前根据网友们的挖掘,这个模型确实很值得期待哎!例如"底部有孔的桶能储水吗?

2025-03-24 23:26:00 947

原创 开源11B视频生成模型,表现媲美主流闭源模型!权重+代码全流程公开

潞晨科技正式推出 Open-Sora 2.0—— 一款全新开源的 SOTA 视频生成模型,仅 20 万美元(224 张 GPU)成功训练商业级 11B 参数视频生成大模型。开发高性能的视频生成模型通常耗资高昂:Meta 的视频模型训练需要 6000 多张 GPU 卡片,投入数百万美元~~。在多项关键指标上,它与动辄百万美元训练成本的模型分庭抗礼,全面提升视频生成的可及性与可拓展性。今天,视频生成领域迎来开源革命!Open-Sora 2.0——全新开源的视频生成模型正式发布,仅用。

2025-03-15 16:40:27 2363

原创 百万年轻人“抽象“创作,AI二次元社区「狸谱」凭啥火出圈

最近刷小红书、B 站总是能看到一些奇奇怪怪又可爱到炸的东西。有人把猫咪变成挂件,有人把偶像挂在包上,一切都能变成可爱挂件,就像这样——从心爱的爱豆到动漫里的纸片人,都被“封印”进了可爱的挂件里。这股风潮,在小红书上刮得相当猛烈,话题浏览量直逼 800 万。我翻了一下,原来大家都在玩儿的 APP 来自我的老朋友——狸谱。那我就不奇怪了。之前,就是对任意一个物件都能提取它的二次元灵魂,也是非常火爆,直接让我半只脚踏进二次元圈了。

2025-03-12 20:17:30 2855

原创 原来在千帆上玩儿DeepSeek这么野,我终于把DeepSeek捏成我想要的样子

最近我在研究怎么让 AI 更"懂我"。不是说它不够好,DeepSeek 的能力确实很强。但每次问它问题,总觉得少了点默契。比如我想让它帮我写文案,要反复强调"用轻松的语气"、“别太正式”;让它帮我整理资料,又得不断提醒"重点关注这个领域"、“用行业术语”。更要命的是,很多写作任务的前置环节是资料查找,而市面上搜索能力强的 ChatBot 产品实在不多。想要跟 DeepSeek-R1 捏在一起,就更难找了。每次对话都要重新设定上下文,说实话挺累的。

2025-02-27 12:49:08 3199

原创 秘塔AI上线「新研究模式」!DeepSeek-R1加持还免费,我爱了

它不仅压缩了信息处理的时间,更重要的是跳脱出已知内容的限制,通过推理思维框架,注入了更多维度的认知可能性(说不定我们就能从AI的思考中,碰撞出更多的创新点~)对于这类专业问题,此前很多回答都只是泛泛而谈,想要深入,要么花钱,要么花时间(没个一两天都下不来,效果还不一定好)。虽说现在的答案是否定的,但看着这样详细的步骤,让人不禁对未来有了更多的期待和向往~这样一来,既能保障推理的深度,又能一定程度兼顾到搜索速度,算是一个不错的解法。好在,如今我们能够有更多的选择,为思考和研究提供强有力的帮助。

2025-02-20 16:26:55 2905

原创 马斯克大力出奇迹,Grok3 把 o3 干翻了

大家好,我是含萧。就在刚刚,马斯克发布了 xAI 最新的模型:Grok-3 和 Grok-3 推理版!现在 X 官网上开会员已经可以直接体验,网页和应用的所有功能会在一周内完善、API 会在几周内推出。什么模型才让马斯克敢说是“地球上最聪明的 AI?简单粗暴给大家汇总一下目前的信息:Grok 3 表现超越 DeepSeek R1、GPT-o1、Gemini 2 Pro、GPT-4o、Claude 3.5大模型盲测榜单 LYSYS Arena 有史以来首先打破 1400 分,在所有类别中排名#1。

2025-02-18 21:36:20 3459

原创 文心一言决定开源了!还打出了「深度搜索」研究神器

我这两天注意到,百度文心开始疯狂搞事情了,直接贴官网图——刚刚热乎的官宣,文心 4.5 即将发布,而且是开源。另外这是昨天的消息——得益于文心大模型的持续迭代和推理成本的持续降低,文心一言终于全面免费了。这搞事情的动作太密集了...接连宣布免费、开源背后,可以看到百度更加开放,另一方面,这也是百度的技术底气,近两年来文心大模型能力进化一直在路上,让开发者和广大用户更低门槛地用上大模型的能力。但我发现在最新迭代中,还有个非常更炸的功能升级,刚刚文心一言还上线了一个叫的新功能。

2025-02-14 18:08:36 3619

原创 我终于找到了高并发的极速DeepSeek-R1满血版API,我被火山香到了

DeepSeek 这一波,真的是把各家云厂商都逼急了,你叫得出名字的,叫不出的,纷纷上线了 DeepSeek R1 模型。而且优惠力度非常大——半价、免费、送 Tokens 等,简直把曾经发起 API 价格战的 DeepSeek 官方都卷沉默了。我本来是一直在拍手叫好的,但是作为开发者,我实际用了一圈后,我沉默了。因为我发现不少云厂商,虽然免费,但 TPM(Tokens Per Mintute)给限制的非常低,市面上大部分把 TPM 限制到了 1 万左右,这直接让我懵逼了。这意味着什么呢?来,我给你算一算。

2025-02-14 17:55:27 4069 1

原创 免费不限量!讯飞上线 DeepSeek 全家桶,还支持满血版精调,我爱了

普遍对讯飞的印象,可能还是“国家队”、“语音技术大佬”这些标签,我今天全面体验了下他们产品,能感受到在 AI 生态建设的努力,讯飞开放平台已经发布了 806 项 AI 技术和方案,积累了大量行业 Know-How,还有很多标杆应用。”的组合拳,本质上是在算力红海中划出一条新赛道——这里不拼谁薅的羊毛多,而是提前一步布局,为“AI 雕刻家”提前铺路,帮助其更快的在 DeepSeek 生态中雕刻出业务壁垒。毕竟,要让基础模型充分适配业务场景,学习个性化知识和能力,精调依然是解决该问题来说非常重要的范式。

2025-02-12 20:45:47 3494

原创 千万不要尝试 Qwen2.5-Max,你会因此忘掉 DeepSeek V3

在对 Qwen2.5-Max 深度评测后,我想到了一句话——有人逐日,有人摘星。DeepSeek V3 的发布和爆火,让我们看到了 MoE 模型的潜力,让世界看到中国 AI 的锋芒。探索 AGI 的路上并不孤单,DeepSeek 和 Qwen 都是中国 AI 大模型的代表力量,当然还有很多优秀国产代表。说个冷知识,DeepSeek 将 R1 蒸馏出的 6 个小尺寸模型,有 4 个用的是 Qwen 开源模型,李飞飞最新发布的 S1,也是用 Qwen2.5-32B 作为基座模型。

2025-02-07 19:22:43 4124

原创 终于找到一个靠谱的DeepSeek R1 推理API,限时免费!

DeepSeek-R1 系列模型的开源,因其出色的性能和低廉的开发成本,已引发全球的热切讨论和关注。潞晨科技携手华为昇腾,联合发布。

2025-02-07 18:38:44 3743

原创 这家AI悄悄上线阅读模式,手机刷论文就像看小说一样爽!

临近放假,小伙伴们是不是已经陆续踏上了归家之路!虽然心已经放飞,但是各家AI公司还在卷的飞起,又是发新模型,又是发技术报告,非常火热。我最近发现,秘塔 AI悄悄上线了一个,在手机上读PDF体验非常爽,虽然不是大功能,就是那种会让你觉得用了很舒服的小细节。一直一来,在手机上读PDF体验都不太丝滑,尤其是图表文字混着排版时,上下错位很常见,还有读英文文献,来回切翻译软件非常麻烦。如果你经常看PDF文献的话,绝对懂我说的这个点。正好这两天在路上跑,高频使用了一波,体验下来非常清爽,尤其是对眼睛极其友好。

2025-01-24 15:18:56 3197

原创 我让男同事去测测豆包大模型1.5,结果他被豆包钓成翘嘴了

真的是离谱。众所周知,每当业内有牛逼的大模型发布,肯定免不了被咱们号一顿 case 毒打,让这个模型知道什么叫人类的智慧,让它低调做人。但这次,终于翻车了。事情是这样的。昨天豆包大模型 1.5 全家桶正式发布了嘛,官方刚发布 15 分钟,就被咱们 Family 群里的家人给发现了,并且发出灵魂拷问——谁能测测?行,测测就测测。我就让编辑部的一个男同事去测了。而且我告诉同事,有家人说豆包大模型是非常能给用户提供情绪价值的。情绪...情绪...

2025-01-23 18:00:42 3655

原创 突发!Tiktok美国停服,Perplexity发起收购,小红书也被盯上了

这次意外的“走红”,如同“甜蜜的负担”,在大家都摩拳擦掌等待过年的时候,小红书的同志们键盘不出意外都要冒火星子了。一边是海量涌入的流量,如同天降甘霖,平台收获了空前的流量红利和近乎完美的品牌营销机会;另一边,可能很快就要开始应对来自美国政府可能的战略性关注和审查。。。。。成名的代价,小红书,你准备怎么接!

2025-01-20 16:19:42 3593

原创 长文本“新王”诞生!400万字输入,MiniMax首次开源即王炸

万万没想到,2025 开年惊喜是 MiniMax 给的,就是海螺 AI 背后的中国大模型 AI 创业公司。昨天刷信息流的时候,发现他们刚发布了两个新模型,一个是文本模型 MiniMax-Text-01,另一个是多模态模型 MiniMax-VL-01。统称为模型。今早我刷了下 X,发现 MiniMax-01 也被海外网友刷屏了。有网友提到这是继 Deepseek 之后的另一家来自中国的「OpenAI 级」顶尖开源模型。

2025-01-16 15:21:55 3957

原创 英伟达最强AI芯片GB200被曝故障,微软谷歌Meta 大规模退单,改购H200

受芯片禁令的影响,国内很多小伙伴对大模型训练部署的 GPU 型号感知可能还停留在 H100 甚至 A100 上面。但其实在 H100 之后,不仅诞生了同样是 Hopper 架构的 H200 芯片(于 2023 年底发布),而且 2024 年上半年,英伟达还发布了超越 Hopper 架构的全新 Blackwell 架构。搭载最新 Blackwell 架构的 GPU 芯片,便是 B200。,如下图所示。根据相关测试但这还不够,更恐怖的是,[4]

2025-01-15 12:07:57 4025

原创 Github 趋势榜第一!开源 Agent 开发神器,任意文档转 JSON、MD

不知不觉间,markdown/json 格式似乎已经成为了 AGI 时代的“新基建”。各种各样的文档经过解析工具快速提取并结构化输出为这两种格式后,给各类 Agent/RAG 框架提供稳定的原始文本输入。Docling不仅具备多格式解析能力,且对版面和表格都有较高还原度,还能通过多线程或 GPU 加速来应对大批量处理场景,加上 MIT 许可开源,不失为大家解析文档的一个好选择。

2025-01-15 12:07:01 3856

原创 Sam Altman:2025年,第一批AI Agents将加入劳动力大军

一年多前的那个特殊的星期五,最糟糕的事情莫过于我在一次视频通话中被突然解雇,紧接着,在我们挂断电话后,董事会就发布了一篇相关的声明。回首往事,我当然希望当时能有不同的处理方式,我也相信,与一年前相比,今天的我是一个更成熟、更有远见的领导者。

2025-01-06 23:22:24 3646

原创 GitHub 造假浪潮爆发!已有450万虚假星标,实锤造假将导致仓库限流

"看完这个’星星交易’的故事,不禁让人思考:在开源社区里,真实的价值到底应该用什么来衡量?是浮于表面的数字,还是实打实的代码贡献?而且,小鹿去查了下,星标的价格从几分钱到几元不等,这种价格差异主要由账户的“质量”决定。高价星标通常来自注册时间较长、有一定活跃度的账户,这些账户的星标看起来更“真实”,更难以被平台识别和封禁。而低价星标则来自新注册的、几乎没有任何活动记录的账户,这些星标的风险更高,很容易被平台识别并取消。产业链很成熟。。这些服务还提供“失效包重刷”的保障。。。

2025-01-02 17:55:35 4221

原创 中国发表AI论文数量,全球第一!这些互联网大厂功不可没

而其他主流 AI 顶级学术会议如 ACL、KDD、CVPR、ICML 等,你也会发现,除了清华、浙大等高校外,阿里、蚂蚁、字节、腾讯、百度、小米等大量互联网大厂身影频出,在 AI 这种重算力、重资金的研究赛道,工业界科研团队的含金量在逐渐上升。如果论文基数很大,论文平均引用次数过小,则说明我们的科研投入可能大部分拿去灌水了,做出的高影响力研究太少,这种只能自欺欺人,无法形成真正的、足够大的国际影响力。如今,流行一个词——在平均被引用次数上,中国平均每篇论文被引用 22 次,是美国的一半,印度的 2 倍。

2024-12-30 21:35:22 4032

原创 Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理

HtT 是 DeepMind 开发的有助于 LLMs 学习显式规则并将它们应用于推理问题的框架。通过实验分析,HtT 显著提高了关系推理、数值推理和概念学习问题上 LLMs 的推理性能,消除模型幻觉。目前 HtT 还面临着受限于模型基础能力和上下文长度限制的问题,但是该框架仍具备较大潜力,为使用 LLMs 获取知识规则,消除推理幻觉开辟了新的方向。

2024-12-29 22:22:01 3033

原创 检验创业想法是否靠谱的AI神器!洞察市场机会,定位用户痛点,pmf验证…

好啦,深度体验了一番 GummySearch 后,我对自己之前萌发的创业点子有了更清晰的认识,它给我了我一点阳光,也泼了我一盆凉水。小程序,我觉得它的理念太妙了,因为它把所有你想让对方养成的好习惯变成了可以积分的事情,而不是可能的指责、唠叨,然后积到了一定分数,对方就可以到自己的积分商城兑换礼品。其中,Reddit 作为一个充满活力的全球社区平台,里面有非常丰富的兴趣小组和只有想不到没有找不到的话题,类似国内的百度贴吧、豆瓣,我们不仅可以从中发现灵感、验证想法,还可以找到对应的客户,非常适合验证创业想法。

2024-12-29 22:20:00 2153

原创 OpenAI 突发公司剧变,将分裂为两家组织。野心?还是梦想?

我们希望呢,就是让我们的商业公司成功赚到大笔钱,获得巨大的成功,那么我们这个商业公司就能反哺我们的非营利组织,来为人类谋福利啦~~而第一条,OpenAI 仅能使用 Azure 云,这个也相当卡脖子——GPU 在美国也是紧俏资源,OpenAI 因为这个对赌甚至无法使用其他云厂商的算力。根据官方的说法,OpenAI 希望通过这次重组,来实现”通过营利性组织的成功“来实现”让非营利性组织成功“。如今,OpenAI 的组织分裂,对于人类来说,我觉得也是喜忧参半的。这两家组织的关系,可以用这个网友的评论来总结——

2024-12-29 15:33:44 1598

原创 DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力

逆向思维:从确定的目标状态出发,通过分析因果链条,找到实现目标的路径。这种方法在问题较为复杂,正向思维容易迷失方向时特别有效。以上是 ChatGPT 给出的逆向思维的基本解释。从直观上理解,逆向思维就是从答案反推问题。例如:“Emma 有 2 个苹果,Jack 有 3 个苹果,一共有几个苹果?正向思维就是“2+3=5”,得出一共有 5 个苹果。而逆向思维可以理解为:“已知一共有 5 个苹果,现在 Emma 有 2 个苹果,请问 Jack 有几个?这么做有什么好处呢?

2024-12-29 15:32:00 2252

原创 o1多模态推理终于有了“开源版本”,阿里云通义QVQ一夜爆火

这是我第一次,因为一个大模型的名字和头像,而对其印象深刻。它的头像长这样——看图猜 3 个字母它的名字长这样——看图猜 3 个字母一向严肃的大模型赛道开始变得画风活泼了起来...这个画风奇特的模型,就是刚发布的“开源版多模态推理模型”——,全名是 QVQ-72B-Preview,为视觉推理而生。QVQ 一经发布,就直接在 Twitter 上火了——大量歪果网友也在刷屏秀 QVQ 跑出来的有趣 case——

2024-12-29 15:30:31 1706

原创 我用AI新做了夕小瑶的表情包,被围观了

自从前段时间更新了文章版面后,就经常有家人在 Family 群里夸——然后就会有人疯狂追问这是不是用 ai 做的——众所周知,由于夕小瑶太穷,请不起专业的设计师,但由于自身 AI 能力过硬,所以必然要让 AI 来充当这个苦力。不过,事情的进展并没有止步于此,因为还有很多家人要求出表情包。甚至还有家人直接在评论区逼宫,求插入表情包的。安排!但我试了一圈市面上国内外各类 AI 工具,把 prompt 调炸了也没有一个能生成出来让我满意的表情包的。这竟然让我犯了难。不是表情控制不到位,就是人物风格不一致。

2024-12-22 14:53:13 1443

原创 最强的全模态理解端模型开源,这个轻巧的小模型不仅多基准登顶,推理速度最高还能领先300%

这可能是目前最强的开源今天,无问芯穹宣布正式开源全球首个端侧全模态理解模型 Megrez-3B-Omni,同步开源的还有它的纯语言版本模型 Megrez-3B-Instruct。Megrez-3B-Omni 是一个为端而生的全模态理解模型,Megrez-3B-Omni 选择了最适合手机、平板等端侧设备的。

2024-12-16 20:43:44 1446

原创 今日最佳 AI 论文:简单蒸馏训练,就能超越 o1-preview?

这篇论文在验证蒸馏数据的有效性的同时,也为我们敲响了警钟。简单的蒸馏方法,虽然能带来一时的成效,但从长远来看,过度依赖蒸馏可能会限制我们的视野和潜力。这并不是说蒸馏本质上是有问题的——它仍然是一个有价值的高性价比方法。关键在于,不能让蒸馏的便利使我们偏离了更艰难但最终更有价值的本质性创新之路。研究者应该在两者之间找到平衡点,既能通过快速蒸馏应对工作中可能的 ddl 压力,又能不忘初心,坚持技术创新的本质。毕竟,追寻足迹的影子,永远无法变成光。

2024-12-09 16:43:53 1493

原创 满血版 o1 上线两天,被网友玩出来了 10 个疯狂用法

虽然网友们“方方面面”地验证了 o1 Pro 强大的进步!氮素,奶茶还发现了 o1 Pro 不少翻车的例子 hh!比如:现在几点了?o1 虽然会算数,但是不会读表哈哈哈!大家用 o1 Pro 怎么样,欢迎评论区和我们一起讨论 ~

2024-12-09 16:39:44 1711

原创 不必再期待Sora!谷歌炸出大世界模型,AI无限月读诞生了

现在,这个魔幻的能力逐渐成为现实。我这里先给大家贴一个demo:大伙第一眼看过去,估计都会认为,这就是一个AI生成的视频吧。是,也不是。再看一下呢?视频中的人物的行为,完全是由人类,通过键盘鼠标操控的。而生成这个demo的模型,就是谷歌DeepMind刚刚发布的简单说一下世界模型。在通往AGI的道路上,人们一直在追求一个能理解现实世界,复制现实世界基本动态的模型,这是通往AGI的必不可少的核心。

2024-12-05 20:54:09 1083

原创 昨夜,亚马逊云科技发布大模型工厂,全球上百个顶级模型API自由调用

想多扯几句。Bedrock 的发布,意味着生成式 AI 应用的落地门槛被进一步打下来了。尤其 Marketplace 的概念,更是一个双向的利好——专业的 AI 厂商可以快速连接到目标开发者,而开发者也可以打破信息壁垒,高效率找到目标模型。虽然这不是技术更新,但这个事情本身我觉得是本次大会上的一大亮点,也是现在行业里的真·痛点。而 Marketplace 本身,也是一个上限非常高的商业模式。整体上,我觉得亚马逊这次的 re:Invent 大会比去年的猛料更足,AI 味儿更浓。

2024-12-05 20:44:25 1461

原创 一张图,生成一个世界!李飞飞首个空间智能项目发布

夕小瑶科技说 原创作者 | 海野只需要一张图片,甚至是一句prompt,就能生成一个非常精细的3D世界。让我没想到的是,这个3D世界还允许以第一人称视角有些小伙伴可能有印象,在11月初,一家公司Decart发布过一个项目Oasis:由AI实时生成游戏Minecraft(《我的世界》)的物理世界。它也能探索、转身。我还试玩过一段时间,不得不说,Oasis还需要打磨打磨。其中最让我诟病的是,内容生成的稳定性太差了。本来面前是一片村庄,一转身,就变成新的场景了。

2024-12-03 19:30:22 768

原创 翁荔离职OpenAI后第一个大动作!奖励黑客万字综述!

翁荔大佬在离职后的大动作确实引人注目!她聚焦于强化学习中的一个关键问题——奖励黑客(Reward Hacking)。这一问题涉及到智能体(Agent)利用奖励系统或环境漏洞来获得高额奖励,而并没有真正掌握预期的行为。翁荔呼吁业界加大研究力度,以更好地理解和缓解这一问题。此外,她也坦言这篇研究不易完成~(奶茶看的也非常不易呜呜,请看官大老爷们给个三连!同时也有不少来自OpenAI的前同事对此表示推荐和支持。奶茶将继续期待翁老师的新动作~~

2024-12-03 19:20:42 1138

原创 捏OC?养设子?AI+二次元才是壁垒最深的AI赛道...

这个角色的性别、性格、经历甚至种族(没错,这个角色甚至可以不是人族)都是由作者自己设定的,造这个角色的过程就叫。这个灵魂提取器也有同样的意思——你可以用它把现实生活中的一切实体物品转化为虚拟的艺术作品,无论是你心爱的宠物、窗台上的一盆多肉,还是街角的咖啡馆,都是灵感本身,打破现实与虚拟的界限,成为独一无二的内容创作者。这些设计师通过接单的方式,为有OC需求的用户定制设计原创角色,从前期的设定、造型到最终的立绘完稿,都需要专业的技术和丰富的经验作为支撑。妈耶,夕小瑶的灵魂是一位爱幻想的猫耳少女!

2024-12-03 19:08:54 952

原创 破例两篇!NeurIPS时间检验奖颁给了Ian的GAN、Ilya的Seq2Seq,实至名归

今年NeurIPS时间检验奖颁给了两篇论文!分别是大名顶顶的Ian的和Ilya的。NeurIPS时间检验奖(Test of Time Awards)的颁奖标准是:10年前在NeurIPS上发表、对研究领域产生了重大影响、经得起时间考验的论文。官方自己也承认:今年,我们破例颁发了两篇时间检验奖,因为这两篇论文对整个领域的影响力都不可否认。Ian Goodfellow的名字能被世人熟知,就是通过这一篇GAN论文。

2024-11-28 19:55:23 1083

原创 “奇葩”编程题,仅OpenAI与一国产模型破解,来看看新AGI路线怎么初露锋芒

从第一性原理出发,传统的链式思维,比较像暴力枚举,而让大模型显式的罗列所有可能性,这无疑非常的不像一个“优等生”的脑袋;根据笔者的理解,像“代码写的对不对”,“数学公式的计算结果对不对”,都可以通过推理任务沙盒来辅助验证当下计算/中间结果的正确性,从而为思维过程提供反馈信号,进而验证某条思维链是否合理、正确。从思维链内部来看,中间过程中写过有bug的代码,但从它命名为“Review”的思考部分,说明它具备自我反思的能力,发现了bug并进行代码修正,直到完成一个推理逻辑自洽的代码版本。

2024-11-28 19:48:04 933

原创 谷歌用LLM帮渐冻人用眼神打字,又快又省力!新研究登上Nature 子刊

大语言模型的出现标志着人工智能领域的范式转变,开创了认知计算的新纪元。这一技术突破不仅体现了计算机科学的重大进展,更预示着人机交互模式的革命性变革。除了以上大的意义,大语言模型出现对人类生活质量的产生了大大的改善!SpeakFaster这项突破性的进展让我们看到,通过整合大语言模型与精心设计的用户界面,我们竟然能够如此显著提升患有运动障碍者的沟通效率!,让他们能够更自如地表达思想、参与社会交流。而且,效果如此好!

2024-11-25 16:32:02 780

原创 NEO发布第一位自主机器学习工程师,MLE-bench秒杀了OpenAI o1

AIDE的出现,代表了一种新的尝试,结合代码逻辑和神经网络,专门针对ML进行优化,更适合处理专项专用的问题。在50场Kaggle比赛的测试中,NEO在26%的比赛中赢得了奖牌,超过了搭配AIDE框架的OpenAI o1(16.9%)。在整个工作流中,不同的工作内容对应一个单独的智能体(图中的planner、analyzer等),不同的智能体驱动不同的模型进行各项工作内容同时进行。这样一来,复杂的问题就可以分解为可管理的组件,现在只需要给定一个具体目标,NEO就能启动一个全面的工作流程来实现这个目标。

2024-11-19 21:46:16 963

原创 最新!LeCun发起的LLM评测榜单中,这个大模型拿下中国第一

同时,需要大模型在知识覆盖范围和深度上也能实力在线,除了能处理常见领域知识,也能理解特定领域或边缘分布中的复杂问题。今日消息,国际权威榜单 LiveBench 官网公布了最新的语言大模型测评结果,阶跃星辰自研的万亿参数语言大模型 Step-2 的技术表现位列中国基座大模型第一,成绩逼近 OpenAI 的 o1-mini-2024-09-12,超越 gpt-4o-2024-08-06 、gemini-1.5-pro-002 等国际主流模型,是唯一进入榜单前十名的中国语言大模型,位列全球第五。

2024-11-19 21:44:29 690

原创 AIGC的全新机遇!北京这场专家云集的AIGC国际会议与大模型应用峰会即将启幕

为了探讨这一领域的未来方向,分享最新的科研成果,促进国际间的合作交流,“第二届人工智能生成内容国际会议暨大模型应用创新大会”(AIGC 2024)将于2024年12月21日至22日在北京隆重召开。随着算法的进步和计算能力的增强,未来的AIGC将更加精准地捕捉用户需求,创造出更加个性化、多样化的内容。来自国内外的众多院士、专家、学者、教授,以及人工智能领域的企业代表和专业人士齐聚一堂,共同分享前沿学术成果,交流思想观点,探讨产业应用,推动了AIGC领域的快速发展,吸引了600余名与会者。

2024-11-19 20:39:13 532

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除