• 博客(20)
  • 收藏
  • 关注

原创 NotebookLM 音频概览支持中文;扎克伯格 LlamaCon 发言:语音当下被低估了,未来语音交互将占据更大比重丨日报 RTE开发者社区 RTE开发者社区

我们欢迎更多的小伙伴参与。

2025-04-30 16:39:52 945

原创 沐言智语开源 Muyan-TTS:基于高质量播客数据集,二次开发友好;Ztalk.ai:实时语音会议翻译,支持 30+语言丨日报

我们欢迎更多的小伙伴参与。

2025-04-29 16:51:16 983

原创 ElatoAI:开源 ESP32 AI 语音 AI 玩具方案;凯叔推出 AI 故事玩偶「鸡飞飞」丨日报

我们欢迎更多的小伙伴参与。

2025-04-28 20:02:28 711

原创 徽客松S1 | 合肥首场 AI 黑客松招募

我们和本次「徽客松」发起人 SDL 也是在一个黑客松上相识。当你的城市还没有黑客松可参加,与其等待,不如学习 SDL,自己发起一个!越来越多的黑客松在各个城市出现!5 月 10 日,合肥,12 小时极速挑战。

2025-04-27 20:34:43 485

原创 月暗开源 Kimi-Audio,单一框架执行多种语音任务;照片秒变可对话数字人,LemonAI 推出 Slice Live丨日报

我们欢迎更多的小伙伴参与。

2025-04-27 18:59:13 925

原创 Rime 最新 TTS 模型 Arcana:能听到呼吸声和轻微口腔音;Bubba AI:专为卡车司机打造的语音交互智能体丨日报

我们欢迎更多的小伙伴参与。

2025-04-25 19:22:49 830

原创 视频丨Google 最新 AI 眼镜原型曝光:轻量 XR+情境感知 AI 打造下一代计算平台

从「看见」环境到「理解」环境,从「指令式」交互到「对话式」交互,从「工具」角色到「伙伴」角色,轻量 XR+情境感知 AI 正在塑造下一个计算平台。「AI 和 XR 正在融合,解锁人机交互的全新范式,计算机将变得更加轻量级和个性化,它们会共享你的视角,了解你的真实世界背景。轻量化 XR 设备与情境感知 AI 的结合,正在「增强现实」迈向「增强人类智能」,未来将提供更自然、个性化的人机交互方式。多语言翻译,未经预先告知,仅需注视西班牙语标识,Gemini 就能即时翻译成多种语言,如波斯语,印地语等;

2025-04-25 19:06:26 578

原创 字节推出 LiveCC,首个实时评论视频模型;AI 客户访谈初创 Listen Labs 融资 2700 万美元,红杉领投丨日报

我们欢迎更多的小伙伴参与。

2025-04-24 19:15:41 1049

原创 C.AI 推出 AvatarFX 模型:让图片角色开口说话;Grok 升级视觉理解,支持多语种语音和语音实时搜索丨日报

我们欢迎更多的小伙伴参与。

2025-04-23 18:47:48 827

原创 我们收到了数百份AI“生存提案”|72小时AI生存挑战招募中

更多 Voice Agent 学习笔记:级联vs端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?丨Voice Agent 学习笔记a16z 最新报告:AI 数字人应用层即将爆发,或将孕育数十亿美金市场丨 Voice Agent 学习笔记a16z合伙人:语音交互将成为AI应用公司最强大的突破口之一,巨头们在B2C市场已落后太多丨Voice Agent 学习笔记ElevenLabs 33 亿美元估值的秘密:技术驱动+用户导向的「小熊软糖」团队丨Voice Agent 学习笔记端侧

2025-04-22 21:23:25 136

原创 阶跃星辰发布端到端语音接口 Realtime API,理解情绪、随时打断;Dia TTS:生成语音可带笑声、咳嗽声、清嗓子丨日报

我们欢迎更多的小伙伴参与。

2025-04-22 21:02:37 1037

原创 Google创始人:未来一年绝大多数程序员将被AI取代;FeedbackStream:8分钟创建语音访谈智能体,输出高质量洞察

我们欢迎更多的小伙伴参与。

2025-04-21 22:26:35 823

原创 级联vs端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?丨Voice Agent 学习笔记

总体而言,效率是议价指标,平台开放性决定效率。例如,如果一家Voice Agent公司接入硅基流动平台,理论上就有可能可以接所有的模型进行收费。

2025-04-21 22:02:16 1028

原创 Hume 推出 Octave TTS 即时模式,250 毫秒响应;客服语音智能体 Sona:简单集成、高度自定义丨日报

OpenPhone 发布了一款客服语音智能体产品 Sona,专为提升企业通信效率而设计。它能够全天候响应来电,自动捕捉潜在客户信息、解答常见问题,并完整记录通话数据,帮助团队快速高效地跟进。Sona 支持高度自定义——可以自主控制其介入时机和协助方式。企业可根据需求灵活设置其工作流程,且无需复杂集成,简单配置即可快速投入使用。尤其适合依赖客户咨询的服务型企业、人员有限的中小团队,以及注重专业形象与响应速度的企业。

2025-04-18 22:17:05 726

原创 Edge 浏览器推出 Copilot Vision:免费实时解析屏幕内容;Aqua Voice:极速 AI 语音输入工具丨日报

开发者朋友们大家好这里是,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的」、「有亮点的」、「有思考的」、「有态度的」、「有看点的」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。本期编辑:@赵怡岭、@鲍勃。

2025-04-17 19:24:57 942

原创 AI 语音公司 ElevenLabs 进军亚太市场设立东京子公司;EverTutor Live :语音交互 AI 教育平台丨日报

开发者朋友们大家好:这里是,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的」、「有亮点的」、「有思考的」、「有态度的」、「有看点的」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

2025-04-16 20:01:05 790

原创 从开发者视角解读 Google Cloud Next 25

我们欢迎更多的小伙伴参与。

2025-04-15 18:58:55 928

原创 MiniMax 发布新 TTS 模型 Speech-02,轻松制作长篇有声内容;Meta 高端眼镜年底推出,售价上千美元丨日报

开发者朋友们大家好:这里是,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的」、「有亮点的」、「有思考的」、「有态度的」、「有看点的」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

2025-04-02 18:51:57 1253

原创 与 AI 共处 72 小时,没有食物、水、手机,会发生什么|寻找「赛博鲁滨逊」

更多 Voice Agent 学习笔记:a16z合伙人:语音交互将成为AI应用公司最强大的突破口之一,巨头们在B2C市场已落后太多丨Voice Agent 学习笔记ElevenLabs 33 亿美元估值的秘密:技术驱动+用户导向的「小熊软糖」团队丨Voice Agent 学习笔记端侧 AI 时代,每台家居设备都可以是一个 AI Agent丨Voice Agent 学习笔记世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过多模态 AI 怎么玩?这里有 18 个脑洞AI 重塑宗教体验

2025-04-02 18:14:19 283

原创 a16z合伙人:语音交互将成为AI应用公司最强大的突破口之一,巨头们在B2C市场已落后太多丨Voice Agent 学习笔记

这很有趣,

2025-04-01 21:17:08 1053

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除