1、介绍
基于阿里巴巴通义实验室自研SeACo-Paraformer-长音频版的语音识别、端点检测、标点预测、时间戳功能、角色区分、热词定制化功能
2、使用方式
自由复制所需段落,或者设置说话人标识,一键裁剪、添加字幕
Step1: 上传视频或音频文件(或使用下方的用例体验),点击 识别 按钮
Step2: 复制识别结果中所需的文字至右上方,或者右设置说话人标识,设置偏移与字幕配置(可选)
Step3: 点击 裁剪 按钮或 裁剪并添加字幕 按钮获得结果
3、方案
FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频
4、开源方案特色:
-开源性和便捷性 : FunClip 作为一个完全开源的工具,提供了一个本地部署的解决方案,使得用户可以自由地使用和修改。
-高效的语音识别 : 通过集成 Paraformer-Large 模型,FunClip 能够提供高质量的语音识别效果,并且支持热词定制化,以提升特定场景下的识别准确率。
-说话人识别 : 利用 CAM++ 模型