• 博客(1190)
  • 收藏
  • 关注

原创 OpenAI 情人节正式关停 GPT-4o,引发大规模用户抗议;AI 社交应用 Elys 一夜爆红,已融资 2 亿元丨日报

AI 原生即时通讯社交平台 Teamily AI 正式上线。该平台打破了传统的单人助手模式,

2026-02-15 09:42:39 675

原创 KCD Beijing + vLLM 2026 议题征集中!

🎯议题征集中🎤讲者招募中🌱社区共建中欢迎转发给你的同事和朋友,也欢迎你,亲自站上这个舞台。2026 年 3 月 21 日,北京见。阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么​。

2026-02-15 00:22:03 970

原创 日本线下黑客松报名丨AI 开发者集结!VOX TOKYO:让声音拥有改变社会的力量

如果你也觉得现在的 AI 不该只会打字——而是应该能,甚至还能自己跑流程——那举办的 VOX TOKYO 就是一次很适合“直接上手”的线下冲刺。这是一场聚焦的线下黑客松。我们邀请开发者、创业者和创意人才齐聚川崎,利用,在内做出一个能 Demo 的语音 AI Agent 原型。新手也欢迎,现场有人一起 vibe coding,餐饮饮料都安排好,你只要带电脑 + 一个点子来就行。作为 RTE 开发者社区关注的实时交互(Real-Time Engagement)场景,我们也会鼓励大家用。

2026-02-15 00:01:37 763

原创 感知无界·创造有形:百灵全模态 Ming-flash-omni-2.0 焕新生活想象

马年将至,百灵 Ming-flash-omni-2.0 正式焕新登场!在这个辞旧迎新的时刻,让我们先请出 Ming-flash-omni-2.0 为大家送上一份特别的“马年祝福”!

2026-02-14 10:16:09 634

原创 融资 1 亿美元李飞飞参投,斯坦福小镇论文作者创立数字孪生公司 Simile;小红书开源一体化语音识别系统 FireRedASR2S 丨日报

我们欢迎更多的小伙伴参与。

2026-02-14 09:57:05 599

原创 Tavus 发布视听感知模型 Raven-1,捕捉用户语气、表情及语境;「雷格斯」获投数千万,探索「硬件+IP+AI」生态丨日报

我们欢迎更多的小伙伴参与。

2026-02-12 10:38:35 722

原创 有奖活动丨首套语音 AI 盲盒邀你来拆!对话式 AI「黑话」周边空降,谁能看懂这些梗?

各位 RTE 开发者社区的小伙伴们,这一年,我们聊 ASR、TTS、LLM,在 TEN Framework 的各种模块里反复跳跃。在代码世界里,我们习惯了将 ASR、TTS、LLM 像积木一样拼装成强大的 Voice Agent。最近,社区偷偷搞了一件大事,我们把这些「模块」给实体化做成了新春周边盲盒大礼包(你就说这些够不够 Physical 吧?),这不只是一份新年礼包,更是一次 Voice Agent 社区内部的暗号对接。

2026-02-12 10:08:37 994

原创 a16z 领投 AI 伴侣 Shizuku AI:让社区参与 AI 角色成长;夸克 AI 眼镜新增直播功能丨日报

我们欢迎更多的小伙伴参与。

2026-02-11 16:30:53 1205

原创 从通用智能到场景实战:如何定义好用的「Voice Agent」?

AI 的进化速度太快,单打独斗的时代已经过去。我们解读这篇论文,是希望所有 Voice Agent 的从业者关注这种“场景化测评”的趋势。VoiceAgentEval 给出了外呼场景的一种答案,更像是一次示范:如何把一个具体业务,拆解成可被复用的评测单元。当 Evals 从“纸上谈兵”回归到“实战演练”,当底层的实时交互框架逐步成熟,Voice Agent 才有可能真正走出实验室,接受千行百业的复杂检验。

2026-02-11 15:47:18 708

原创 小微商家 AI 开发平台「码上飞」:「打电话」即生成应用;ElevenLabs 新一轮融资估值飙升至 110 亿美元 丨日报

我们欢迎更多的小伙伴参与。

2026-02-06 11:29:38 896

原创 面壁智能发布 MiniCPM-o 4.5,端侧全双工实时音视频交互;海马爸比推出首款 AI 魔法打印机,语音生图+即时打印丨日报

我们欢迎更多的小伙伴参与。

2026-02-05 23:02:13 591

原创 Soul 开源实时数字人模型,0.87s 亚秒级延时;DeepL 发布 Voice API,支持实时语音到语音翻译丨日报

我们欢迎更多的小伙伴参与。

2026-02-04 21:14:42 1056

原创 Apple 20 亿美元收购「无声对话」公司 Q.ai,微表情识别无声指令;AI 玩具 FoloToy 连获数千万元融资丨日报

我们欢迎更多的小伙伴参与**「RTE 开发者日报」**内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。作者提示: 个人观点,仅供参考​。

2026-02-03 11:20:27 824

原创 释放Talkie能力,MiniMax发布角色扮演模型M2-her;Genspark推出AI听写工具,集成Agent模式丨日报

MiniMax 近日发布了其最新技术成果 MiniMax-M2-her,作为星野和 Talkie 的底层模型,M2-her 致力于打造更深层次的 Role-Play 体验。经过三年的观察与迭代,MiniMax 团队发现,用户与 NPC 的互动呈现出明显的长尾特征,即便是冷门角色也拥有一批忠实用户。因此,Role-Play 的核心不在于单一角色的复刻,而在于用户与角色在特定「世界观 × 故事线」坐标下,针对「用户偏好」共同编织的独特旅程。

2026-01-30 14:40:28 1191

原创 月之暗面发布 Kimi K2.5:升级原生多模态与并行智能体机制;首例「AI 幻觉」侵权案宣判:AI 承诺不具法律效力丨日报

系统自动提炼通话核心细节并生成结构化摘要,为后端护理团队提供上下文背景,以降低随访摩擦并提高处理优先级准确性。

2026-01-30 00:35:41 691

原创 年度开发者嘉年华!最流行的开源技术社区基本都来了!1 月 31 日,来上海赴一场技术之约~

点击 https://ask.oceanbase.com/t/topic/35638331 ,解锁 OceanBase 社区嘉年华当日路线图、交通指南及全套实用攻略!1 月 31 日,上海,我们不见不散~下午属于 AI Coding 专场,issue 已公开,Everything is ready to go. Have fun!Mentor 已就位,现场除了能 Prompt AI,还可以向他们请教哦~与此同时,超有料的社区开放麦等你来打卡!解锁技术前沿实践与思考!复制下方链接到浏览器查看。

2026-01-28 17:37:40 78

原创 阿里发布 Qwen3-Max-Thinking;阶跃星辰获超 50 亿融资,加速推进「AI 进入物理世界」丨日报

我们欢迎更多的小伙伴参与。

2026-01-28 13:07:38 646

原创 百度发布文心 5.0,原生全模态统一建模;AI 讲 PPT 智能体 Interactpitch 登榜 PH:交互式 AI 演示,实时数据追踪丨日报

我们欢迎更多的小伙伴参与。

2026-01-27 09:47:34 630

原创 AI Agent 黑客松报名通道开启,你的「一人公司」就差这一步丨活动推荐

由 OpenBuild 联合 SegmentFault、VibeFriends 和 Monad 共同发起,并携手 KIMI、智谱 AI、豆包编程、YouWare、阶跃星辰、Rokid、硅基流动、立创开源等多家顶尖 AI 公司举办的「Rebel in Paradise AI 黑客松」已正式拉开帷幕。这场聚焦“智能体时代原生基础设施、产品与市场”的深度探索之旅,现已面向全球开发者开放报名通道。如果你的桌面还堆满关于 AI Agent 的技术文档却无处实践;

2026-01-27 09:12:53 757

原创 Qwen3-TTS 系列开源;谷歌收编语音 AI 初创 Hume AI;曝 vivo 叫停 AI 眼镜项目丨日报

我们欢迎更多的小伙伴参与**「RTE 开发者日报」**内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。作者提示: 个人观点,仅供参考​。

2026-01-24 10:51:19 580

原创 微软开源 VibeVoice-ASR 模型,支持一小时长音频处理;苹果首款 AI 设备:AirTag 尺寸胸针,双摄三麦 丨日报

Microsoft 发布「VibeVoice-ASR」语音识别模型,突破了传统 ASR 依赖短音频切片的限制,支持单次处理长达 60 分钟的连续音频。该模型通过 64K token 上下文窗口,在单一推理过程中联合完成识别、说话人日志与时间戳生成。

2026-01-23 11:27:29 641

原创 阶跃星辰开源多模态模型 Step3‑VL‑10B,小模型实现大模型能力;华为或将发布首款 AI 眼镜,支持同传拍照 丨日报

我们欢迎更多的小伙伴参与。

2026-01-22 12:48:14 653

原创 估值 5 亿美元,AI 视频调研初创 Listen Labs 再获 6900 万融资;小米 AI 眼镜接入蚂蚁阿福变身 AI 医生 丨日报

我们欢迎更多的小伙伴参与。

2026-01-21 11:52:22 763

原创 AI 具身化不可挡!从指令到对话,揭秘下一代 AI 原生硬件的技术底座 | CES2026

当 AI 长出身体,从能听会说到能看会动!Agora Convo AI World 拉斯维加斯之夜活动回顾主笔:周森审校:小炫编辑:陈述AI 不再仅仅是屏幕里的对话框,从能感知情绪的陪护机器人,到具备实时翻译能力的智能眼镜,AI 硬件化成为 CES 2026 呈现的重要趋势。然而,在 AI 硬件热潮背后,行业也在迫切寻找一个答案:当 AI 试图长出「身体」,它需要怎样的底层架构与交互逻辑?

2026-01-21 11:09:59 703

原创 活动推荐:1 月 24 日北京|Data for AI Meetup:Agent 时代的数据基础设施正在如何重构?

以下内容来源于DataforAI社区,作者Data for AI大模型并没有直接带来 AI 应用的成熟。真正决定 AI 能否规模化落地的,正在从模型本身,转移到。与此同时,数据基础设施也正经历一轮深刻演进:从传统的数据湖仓,到多模态数据管理;从 SQL 查询引擎,到面向 AI 的数据解析与治理能力。这些变化,正在重新定义我们构建 AI 应用的方式。将携手举办,邀请来自产业、开源社区与学术界的一线实践者,围绕展开深入交流。本次 Meetup 汇聚了来自。

2026-01-20 11:36:21 704

原创 Kyutai开源轻量化模型Pocket TTS ;Deepgram C轮融资估值达13亿美元,收购餐饮AI公司丨日报

我们欢迎更多的小伙伴参与**「RTE 开发者日报」**内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。作者提示: 个人观点,仅供参考​。

2026-01-15 11:19:21 639

原创 OpenAI 新音频硬件曝光,想替代 AirPods,目标出货 4000 万副;Amazon AI 新硬件隐私策略:转录对话数据后立即丢弃音频丨日报

我们欢迎更多的小伙伴参与。

2026-01-14 14:35:56 600

原创 杭州场来了!全球首款 AI 主题桌游试玩会丨 RTE x 环球黑客松

2016 年,几个刚毕业的小伙获得了一场黑客松的冠军,随后获得了真格基金的关注与投资,后续在 2025 年做出了全球首个通用智能体 Manus,于年未被 Meta 以数十亿美金收购。2024 年,在哥大上本科的若涵和一霖,在参加一场量子物理黑客松时得到了灵感,随后创业做了 Al 教育产品 Hyperknow,并获得了投资。2025 年,复旦大学在读博士梁帅,通过参加魔搭社区“Al+ 硬件”创新大赛获得了奇绩创坛的投资,从一名学生成长为了一名创作者。

2026-01-14 14:13:10 781

原创 2026 新年开源线上黑客松活动

每个项目都有独立的任务、规则与奖励,你可以专注一个方向,也可以多线探索。提交 PR、构建集成方案、设计工作流实验、优化记忆结构与检索逻辑。构建 Agent 网络、设计协作流程、打造可复用的应用场景。全栈应用开发、基础设施配置、Agent 部署与运维。💻 向项目提交issue、PR、use case。你可以:独立完成、专注一个项目或同时参与多个方向。每一次有价值的贡献,都会被记录在真正的开源项目中。核心功能修复、扩展能力、框架级设计优化。一键部署、打造可直接交付的生产级应用。🔧 五大赛道,任你选择。

2026-01-14 13:41:29 187

原创 国内首例 AI 伴侣聊天提供者涉黄获刑,二审将开庭;OpenAI :大模型能力过剩,未来重心将转向系统层与应用层丨日报

我们欢迎更多的小伙伴参与。

2026-01-13 22:21:15 719

原创 OpenAI 揭秘 Tolan 背后 AI 技术:如何让语音智能体拥有连贯记忆和稳定人格?丨 Voice Agent 学习笔记

忘掉是为了记住——为了保持记忆质量,Tolan 每晚都会运行压缩任务,删除低价值或冗余条目(例如「用户今天喝了咖啡」)并解决记忆中的矛盾之处。哈喽大家好~这是 Voice Agent 学习笔记系列的又一篇深度分享。我是课代表瓒 an👩🏻‍💻是由初创公司 Portola 打造的一款「语音先行」的 AI 伴侣应用。它没有选择模拟真人,而是塑造了一群可动画化、友好且极具个性的外星生物,能响应你的触摸和声音,并随着时间的推移形成关于你们友谊的记忆。自上线以来,Tolan 已在全球获得。

2026-01-10 22:43:20 1007

原创 AI 语音随访患者,AI 医疗初创 Tucuvi 融资 2000 万美元;Gmail 升级 AI 版,转型主动式智能体助手丨日报

我们欢迎更多的小伙伴参与。

2026-01-10 22:31:58 885

原创 西工大开源 VoiceSculptor:自然语言灵活设计音色;BreakReal R1:全球首款对话式 AI 调酒机丨日报

我们欢迎更多的小伙伴参与**「RTE 开发者日报」**内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。作者提示:个人观点,仅供参考。

2026-01-09 10:29:45 665

原创 如何用 Fun-ASR-Nano 微调一个「听懂行话」的语音模型?丨Voice Agent 学习笔记

虽然通用在大多数场景下表现不错,但有些时候,面对专业术语、特定口音或私有词汇时,难免“听错”甚至“幻听”,比如把内部产品代号识别为常见词,或在方言会议中漏掉关键信息。如果你希望模型自己的是一个高效且实用的选择。通过使用领域内标注数据微调模型(几百到几千小时不等),可以在特定场景、特定领域、特定用户群体下的,让通用的模型更好地适应具体应用需求。微调后的模型在保持通用能力的同时,在目标场景下表现更优。为了让你更轻松地定制语音识别能力,我们支持了模型微调的代码。

2026-01-09 09:38:42 732

原创 Razer 发布 Project AVA:全息数字人+游戏屏幕实时分析;Liquid AI 发布端侧端到端音频模型丨日报

这款智能积木的外观和经典 2x4 积木无异,内部却是一台微型电脑。乐高官方宣布,该产品将于 2026 年 3 月 1 日正式发售。不同于以往依赖外置电池的大型马里奥组件,智能积木采用了定制 ASIC 芯片,体积小巧且支持无线充电。智能积木的核心能力在于「感知」与「互联」。它内置了惯性传感器、光线传感器及 NFC 读取器,能够检测运动、倾斜手势,并识别周围嵌入了智能标签的新型光板或人仔。更具突破性的是,积木之间能通过蓝牙组建 Mesh 网络,相互感知位置与方向。

2026-01-08 18:50:34 813

原创 当 AAAI 遇见Voice Agent——MagicHub Meetup 2026首站·新加坡AAAI同期交流会丨活动推荐

未来晴数智慧(Magic Data)还将在国内外多地举办形式多样的线下活动,包括技术研讨、实践沙龙、行业峰会等,构建持续交流的Voice Agent生态圈。在惬意氛围中,享冷餐轻食、饮品畅饮,与行业精英自由互动、闪电分享、随机碰撞合作灵感。借助AAAI 2026国际顶级学术盛会的东风,汇聚来自世界前沿的研究者、工程师与创新团队,打造一场小而精、专而深的行业对话。围绕即将到来的语音交互革命,探讨数据如何定义体验、驱动进化,携手探索下一代Voice Agent的落地蓝图。Singapore Expo附近酒店。

2026-01-08 18:35:44 347

原创 旧金山活动丨聊聊 AI 客服和 AI Call Agent,Conversational AI Meetup@SF,1 月 12 日

语音智能体正在越来越多的行业加速落地。本期主题聚焦「AI 语音客服」——作为 Voice Agent 最早落地的应用场景之一,它如今正面临哪些真实挑战?目前已确认的嘉宾背景涵盖客服 AI、语音模型、智能体框架、实时通信、语音 AI 社交应用以及 AI Infra 等方向。旧金山的开发者与创业者们,我们的 Conversational AI Meetup 又来啦。这是一场能接触前沿技术与产品的聚会,也能交朋友的轻松聚会,披萨和饮料也管够,欢迎报名参加。期待你的加入,一同探索语音驱动的下一代人机交互界面。

2026-01-08 18:22:26 298

原创 1956-2026:人类与机器智能的七十年对话

1956年夏天,当约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Lee Minsky)等先驱在达特茅斯学院首次提出“人工智能”这个概念时,他们乐观地预言:十年内机器将具备人类级别的推理能力。七十年过去了,这个预言虽未完全实现,但AI的演进轨迹却远比当初设想的更加波澜壮阔——从符号推理的黄金时代到“AI寒冬”的沉寂,从机器学习的复兴到深度学习的爆发,再到2026年AI全面融入产业基础设施的当下。

2026-01-07 00:14:34 920

原创 云看展 CES 的最佳姿势出现了! 4177 家 CES 展商完整列表丨社区项目推荐

如果「云逛展」还不够,还可以看看 RTE 开发者社区最近上线的「Voice Agent 100 创新榜」。你也可以根据数据库打造一个自己最舒适的云看展姿势。榜单也还在持续更新中,如果你正在做 Voice Agent 或者看到有意思的 Agent,都欢迎联系我们推荐入榜!你可以通过中英文关键词查询项目,譬如搜索「Voice」,可以看到和「Voice AI+硬件」相关的项目。

2026-01-06 23:57:30 228

原创 Wispr 曝光内部项目:不仅转录文本还执行任务;苹果将推送 LLM 架构 Siri:支持屏幕感知与应用调用丨日报

我们欢迎更多的小伙伴参与。

2026-01-06 23:43:05 999

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除