Jump AI在音视频抠图和语音降噪方面,功能独特,这里我列出具体的功能清单,希望对大家有所帮助。
1. 视频实时抠图
- 支持手机、电脑和魔镜等智能终端的实时抠图,cpu占用最低到1.4%
- 支持各种分辨率, 从320x240到4K高清视频,处理单帧时间最短在6ms;
- 支持对人、动物、物体的抠图,支持对光影的模拟,支持沉浸式广告植入
- 支持对桌面任何窗体的沉浸式融合
人景融合-业界优秀的实时抠图算法
2. 语音降噪
- 去除键盘鼠标、空调、机器、汽车喇叭,各种叮当和和各种机器发出的非人类声音;
- 语音处理每10毫秒处理一次,cpu占用最低 5%左右,arm芯片手机占用10%左右;
- 参数指标领先, 去除噪音的部分指标高于美国同行公司
语音实时降噪
3. 音视频监管
- 语音识别,涉及普通话,粤语和英文等语种;
- 语义理解,鉴别广告文本,涉黄文本、反恐反暴,涉证文本,辱骂文本等;
- 图像鉴别,包括涉黄图片,涉证图片,暴恐图片,违禁图片,广告图片和系列OCR识别