【通义听悟】公测注册邀请链接 音频转字幕 实时会议记录

【通义听悟】我发现了一个宝藏产品,推荐给你~ https://tingwu.aliyun.com/u/bOgH3Jcc0ccJJ3cJ 工作学习AI助手,依托大模型,为每一个人提供全新的音视频体验。点击链接立即注册,公测期免费体验。

6月1日,阿里云宣布通义大模型新进展,AI音视频新品“通义听悟”正式上线,并且正式开启公测。

通义听悟是基于阿里云通义千问大模型开发的AI应用,主要针对音视频内容进行转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。
在这里插入图片描述
通义听悟

不同于传统的实时会议速记转写,如今面向C端提供视频转写服务的应用尚在少数。而如今的通义听悟,则从纯粹的音频转写,延伸到了音视频领域,融合了十多项AI新功能。

阿里云智能CTO周靖人表示,听悟集成了阿里最先进的语音和语言技术,比如,阿里新一代工业级语音识别模型——其识别准确率在多个权威中文数据集上名列第一。融合自研语音语义多模态说话人算法后,听悟能对10人以上说话场景进行角色区分。如今有了通义千问大模型的能力,听悟也能够对上万字的音视频内容进行摘要总结。

在听悟中,用户可以将视频/音频上传,完成录音转写。根据36氪的体验,在音频转写速度上,听悟的处理速度不错——对1-2小时的音频,听悟一般在数分钟内就能转写完毕。

音频转写完毕后,听悟还能够做到中英对照翻译,还能够一键总结会议要点,划分章节、区分不同发言人的观点、整理待办事项等等。

根据阿里云,通义听悟未来还有更多基于大模型的功能上线。比如,对视频中出现的PPT,AI能够基于通义千问大模型做到一键提取,而用户也能向AI助手针对多个音视频内容进行提问、让听悟概括特定段落等等。

值得注意的是,听悟目前针对一些细分场景中提供了不同的部署形态,如浏览器插件。在Chrome安装听悟插件后,听悟在无字幕视频中就可以实时生成双语悬浮字幕。二转写结果可下载为字幕文件,方便新媒体从业者视频后期制作。
在这里插入图片描述
通义千问Chrome插件示意图,近期该功能将上线

Chrome插件:打开Chrome插件双语悬浮字幕条,外语学习者和听障人士可以随时随地看无字幕视频,AI还可成为“开会替身”,戴着耳机或静音情况下也可读取声源,随时随地代为记录、整理要点。插件目前限量开放中,很快将面向所有用户开放下载。

内容问答:通过chat聊天的方式直接对视频提问,听悟可根据视频学到的内容作答,近期将上线。

提取PPT:课程类内容,听悟可直接抽取视频内PPT截图,近期上线。

场景梳理参考:
在这里插入图片描述

在会上,阿里云也介绍了几个已经落地的应用场景。

比如,在阿里云盘中,用户可以一键转写云盘中的文件,在云盘内在线播放视频时,能够实时生成字幕。

而钉钉的在线会议模块“钉闪记”,同样集成了听悟。在会议结束后,钉闪记所能够输出的也不再是纯粹的速记,而是包含重点摘要的完整文档,可以有效地提升公司内部工作效率。甚至,在开会时,AI可以代为记录会议、整理要点。

听悟会以个人版和企业版两种形式提供服务,未来一段时间就将在夸克APP、阿里云盘等端口提供服务。据阿里云,听悟企业版当前已在阿里集团内部被广泛使用,帮助减少了大量会议记录和整理的工作。

在定价上,听悟也跟随阿里云近期的大降价策略。在公测期间,用户可领取100小时以上听悟免费转写时长。听悟用户可通过每日登陆、官方微博、微信及各大平台社区领取口令码,用户的福利权益可累积,一年内有效。

从通义听悟的发布可以看出,国内大模型厂商除了在底层大模型上快马加鞭外,应用层也不能落下——AI对音视频转写、内容理解等功能“加buff”,某种程度上也是AI将各种通用能力“再做一遍”。通过这些能力,厂商们覆盖开会、上课、培训、面试等场景,嵌入到不同的软件当中,才能挖掘更大的商业机遇。

事实上,通义听悟的前身是阿里云内部一个名为“听悟”的产品,主要功能包括实时会议、音频转写功能,“听悟”自2022年年底就开始小范围内测。
通义听悟是达摩院自主研发的超大规模语言模型,能够回答问题、创作文字,还能表达观点、撰写代码。它基于达摩院长期积累的大规模语言模型的核心技术研发,包括但不限于自然语言处理、机器学习和深度学习等。
通义听悟具有强大的语言理解和生成能力。它可以理解各种语言的文本,包括中文、英文、日文、法文等,并且可以生成高质量的文本,如新闻报道、广告语、诗歌、故事等。此外,通义听悟还能够表达观点,进行对话交流,并根据不同的场景和需求,生成不同的回答和建议。
通义听悟不仅仅是一个工具,更是一个能够帮助人们提高效率、创造价值的智能助手。它可以应用于各种领域,如智能客服、智能教育、智能写作、智能翻译等,为人们带来更好的体验和服务。

通义听悟

【通义听悟】我发现了一个宝藏产品,推荐给你~ https://tingwu.aliyun.com/u/bOgH3Jcc0ccJJ3cJ 工作学习AI助手,依托大模型,为每一个人提供全新的音视频体验。点击链接立即注册,公测期免费体验。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Oraer_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值