通义听悟是一款功能强大的智能工具,适用于会议、课程、访谈、培训等场景。它具备实时语音转写能力,能完整沉淀沟通内容,音字对应播放,还可通过搜索定位助力高效回顾;支持海量文件转写,一次可上传 50 个本地文件或阿里云盘文件,自动区分发言人并保存结果;拥有实时中英互译功能,打破跨语言沟通障碍;可快速标记重点、问题、待办事项,便于回顾整理;能轻松导出原文、笔记、音视频和译文等丰富内容,提供 word、pdf、srt 等多样格式;分享方式多样,通过公开链接、微信、钉钉、海报等可安全可靠地将信息高效传递给指定好友。
官网:首页 - 通义听悟
通义听悟的功能如上图所示。
第一种用法适合线下课程、会议或者听讲座时使用,第二种支持传入任意音视频进行处理。
我主要想介绍一下第三种链接转写的用法。
用我前两天看到了一个讲解机器学习的视频为例,该视频原作者发布在YouTube上,又被人转载到了b站,如下:
我们可以复制该视频的b站网页链接:
https://www.bilibili.com/video/BV1ga4y1V7Zg/?spm_id_from=333.1391.0.0&vd_source=c12a835b0e212b8be9fb075e36cae0a7
这是一个在线解析视频的工具网站。
在这个网站中,我们可以将刚刚复制好的b站网页链接转换成其真实视频地址,然后我们复制该真实地址:
回到通义听悟,点击博客链接转写:
点击开始解析,等待解析完成:
右侧需要选择视频语言,也可以选择是否翻译以及是否区分发言人。选择结束后点击“开始转写”即可,整个过程没有很长,耐心等待即可。
它会先解析:
再进行转写:
我选择的这个视频有3小时,而它处理完成只花费了十分钟左右。
处理完成的内容会出现在“我的记录”或者首页下方的“最近”栏,点击即可:
下面是整个处理结果的展示:
发言总结此处可能不太明显,因为发言人只有一个。但是如果整个视频有多个发言人,这里就可以直接得到每个发言人的表述总结。
它也能直接提炼视频中的相关要点,很适合查缺补漏或者复习:
它还能够直接提取视频中展示的PPT,伴随相关讲解内容:
你也能选择一键导出所有图片为PDF文件:
同时,你也能通过时间戳文字直接观看某一时刻的视频:
鼠标光标点击哪个字,视频就会自动跟随播放到相应的位置,非常方便。
同时你还能在右侧记录笔记:
最后是导出功能:
给大家展示一下导出的原文,我一开始以为导出的原文是全文字的,没想到它竟然将特定时刻的对应的视频截图也穿插进了文字。虽然偶尔有一些特有名词可能转换文字不太正确,但是总体来说还是很不错的。