“通义听悟”:智能语言处理的创新之旅

通义听悟是一款功能强大的智能工具,适用于会议、课程、访谈、培训等场景。它具备实时语音转写能力,能完整沉淀沟通内容,音字对应播放,还可通过搜索定位助力高效回顾;支持海量文件转写,一次可上传 50 个本地文件或阿里云盘文件,自动区分发言人并保存结果;拥有实时中英互译功能,打破跨语言沟通障碍;可快速标记重点、问题、待办事项,便于回顾整理;能轻松导出原文、笔记、音视频和译文等丰富内容,提供 word、pdf、srt 等多样格式;分享方式多样,通过公开链接、微信、钉钉、海报等可安全可靠地将信息高效传递给指定好友。

官网:首页 - 通义听悟 

通义听悟的功能如上图所示。

第一种用法适合线下课程、会议或者听讲座时使用,第二种支持传入任意音视频进行处理。

我主要想介绍一下第三种链接转写的用法。

用我前两天看到了一个讲解机器学习的视频为例,该视频原作者发布在YouTube上,又被人转载到了b站,如下:

 我们可以复制该视频的b站网页链接:

https://www.bilibili.com/video/BV1ga4y1V7Zg/?spm_id_from=333.1391.0.0&vd_source=c12a835b0e212b8be9fb075e36cae0a7

然后来到ParseVideo网站:https://www.parsevideo.com/#53616c7465645f5f76a10d8541c9214def0477b3dacc4fac135e841e21af9888a8c3ad6686c7de397f0593632bf20d1fd60aa53dac05e48354f3d44d0e88d51df428cfbbfcaa0d0cb67675409d66fec5c712f753ad6781b31b5395197440e05e773ccba4f6193d3c253e2af2896c9a4e5cb3b213e97407aab3f3fc85487cfbd0

 这是一个在线解析视频的工具网站。

在这个网站中,我们可以将刚刚复制好的b站网页链接转换成其真实视频地址,然后我们复制该真实地址:

回到通义听悟,点击博客链接转写:

点击开始解析,等待解析完成:

右侧需要选择视频语言,也可以选择是否翻译以及是否区分发言人。选择结束后点击“开始转写”即可,整个过程没有很长,耐心等待即可。

它会先解析:

再进行转写:

我选择的这个视频有3小时,而它处理完成只花费了十分钟左右。

处理完成的内容会出现在“我的记录”或者首页下方的“最近”栏,点击即可:

下面是整个处理结果的展示:

 

发言总结此处可能不太明显,因为发言人只有一个。但是如果整个视频有多个发言人,这里就可以直接得到每个发言人的表述总结。

它也能直接提炼视频中的相关要点,很适合查缺补漏或者复习:

 它还能够直接提取视频中展示的PPT,伴随相关讲解内容:

你也能选择一键导出所有图片为PDF文件: 

同时,你也能通过时间戳文字直接观看某一时刻的视频:

鼠标光标点击哪个字,视频就会自动跟随播放到相应的位置,非常方便。

同时你还能在右侧记录笔记:

 最后是导出功能:

给大家展示一下导出的原文,我一开始以为导出的原文是全文字的,没想到它竟然将特定时刻的对应的视频截图也穿插进了文字。虽然偶尔有一些特有名词可能转换文字不太正确,但是总体来说还是很不错的。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值