【项目实训04】开发视频配音功能的实践与收获

enola_ray

已于 2025-05-04 22:35:04 修改

阅读量310

点赞数 5

分类专栏：创新项目实训文章标签：项目创新实训

于 2025-05-04 22:33:51 首次发布

本文链接：https://blog.csdn.net/m0_74097804/article/details/147704727

版权

创新项目实训专栏收录该内容

5 篇文章

订阅专栏

最近正在实现“视频配音练习”功能，用户可以观看视频片段，逐句录音配音，系统再根据中文字幕对用户发音进行评分。过程中有许多收获，以下是记录。

🌟 功能简介

主要功能包括：

视频播放与字幕同步显示
逐句配音录音
上传音频并进行评分（使用后端接口）
录音回放与评分展示

界面简洁，功能明确，适合用户逐句练习中文发音。

📦 技术实现要点

1. 视频播放与字幕同步高亮

通过 <video> 标签播放视频，并用 onTimeUpdate 监听视频的播放进度，利用 currentTime 匹配字幕时间段，动态高亮当前句子：

const time = videoRef.current.currentTime;
const idx = subtitles.findIndex(
  (s) => time >= s.start && time <= s.end
);
setCurrentIdx(idx);

2. 录音功能：MediaRecorder API

录音的关键在于 navigator.mediaDevices.getUserMedia() 和 MediaRecorder，用户点击“配音”按钮即开始录音，“停止”按钮停止录音后，将音频转为 blob 并生成播放链接：

const stream = await navigator.mediaDevices.getUserMedia({ audio: true });
const mediaRecorder = new MediaRecorder(stream);
mediaRecorder.ondataavailable = (e) => {
  audioChunks.current.push(e.data);
};

3. 上传音频并获取评分

录音结束后，我使用 FileReader 将音频转换为 Base64，并 POST 到 /api/dubbing 接口，服务器接收后进行分析并返回一个评分：

const base64 = (reader.result as string).split(",")[1];
const res = await fetch("/api/dubbing", {
  method: "POST",
  headers: { "Content-Type": "application/json" },
  body: JSON.stringify({ audio: base64, text: subtitles[currentIdx!].en }),
});