阿里云正式发布“通义听悟” 首款面向消费者端产品

通义听悟是阿里云新推出的AI助手,基于通义千问大模型和音视频AI技术,提供实时语音识别、多语言翻译、会议记录、内容摘要等功能,适用于职场、学习、媒体等多种场景。该产品可在钉钉、阿里云盘等平台使用,并计划推出更多高级功能,如PPT提取和音视频内容提问。此外,通义听悟企业版已在阿里内部广泛应用,助力提升工作效率。
摘要由CSDN通过智能技术生成

前言

阿里云智能于6月1日发布通义听悟,并面向公众开放公测。阿里云智能CTO周靖人表示,通义听悟是依托通义千问大模型和音视频AI模型的AI助手,可进行实时语音识别,实现对话的实时记录、多语言翻译、发言总结、提取PPT、内容规整等。特别适合职场开会、上课复习、媒体采访、分析师访谈、新媒体工作者整理视频、外语交流等诸多知识类场景。

 据我所了解,通义听悟是通义家族第一个面向大众消费者端的应用产品。在多媒体时代,人们每天记录、分享和观看大量的音频视频内容,通义听悟通过前沿的语音AI技术,能够准确地将音频视频内容转写为易读的文字。根据现场演示,通义听悟可高准确度生成会议记录、区分不同发言人,还可以在一秒内给音视频划分章节并形成摘要、总结全文 及每个发言人的观点、整理关注重点和待办事项。此外,大模型一键提取PPT、针对多个音视频内容向AI提问、概括特定段落等功能也将于近期上线随着大模型能力的飞速进步,通义听悟能为用户提供更多先进的能力,帮助用户梳理和挖掘出音视频内容中的信息价值,并将所有的记录和收集都沉淀为知识资产,随时供用户回顾和利用。

通义听悟另一显著优势是,通义听悟的小程序版后续将在钉钉、阿里云盘、夸克等阿里旗下产品中推出,并与这些产品内部的场景功能及音视频内容融会贯通。公测期间注册的用户后续还将获得更大的阿里云盘存储空间,在云盘内在线播放视频时可自动出字幕。

 周靖人介绍通义听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代工业级语音识别模型,能对10人以上说话场景进行角色区分;接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结帮助用户记录重要会议的要点,捕捉讲座中的精彩知识,整理访谈中的关键信息,为用户提供更深入、更高效的智能服务。

据了解,通义听悟听悟除个人版本外,还有企业级应用通义听悟企业版以在阿里内部广泛使用帮助使用者减少了大量会议记录和整理的工作广受好评。

  • 7
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

顾~浪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值