SummifyAI开源程序基于Whisper、deepseek的音视频转写+总结工具,在也不用长达几十分钟甚至一两小时的长视频网课感到头疼?一键总结音视频并整理成文档,学霸必备

​一、软件介绍

文末提供程序和源码下载

       SummifyAI开源程序基于Whisper、deepseek的音视频转写+总结工具,在也不用长达几十分钟甚至一两小时的长视频网课感到头疼?一键总结音视频并整理成文档,学霸必备。你是否为长达几十分钟甚至一两小时的长视频网课感到头疼?这些视频整体信息密度不高,但偶尔却包含关键知识点,让人不知如何是好。SummifyAI 能将音频或视频快速转写为文字,并通过自定义 prompt 进行总结精炼、笔记整理、摘要生成等一系列操作,大幅提升你的学习与工作效率。

二、功能特性

  • 支持Windows、MacOS  支持 Windows、MacOS
  • 支持多种音频和视频格式输入
  • 基于whisper库在本地进行语音转写
  • 调用 AI 智能添文本修正润色和修正文本,大幅提高准确性(可选用超便宜的deepseek!)
  • 可自定义prompt,进行生成文本摘要和关键信息提取等一系列操作
  • 分步骤处理,可灵活选择执行的功能

三、 安装说明

  • 需要Python 3.10+
# 建议使用虚拟环境(venv或者pyenv),具体方法自行搜索
pip install -r requirements.txt

安装后配置:

  • 在config.py中,配置apikey
  • prompts文件夹中,可编写多个txt文件,作为自定义的prompt,工具会分别处理。
  • 其他高级配置可以暂时不用动
  • 注意:首次使用需要下载whisper库的模型文件,模型文件大小从几十MB、几百MB到1.5GB左右不等

2 使用方法

2.1 web端使用

cd web && python app.py

然后访问 http://127.0.0.1:15000 即可

2.2 命令行使用

usage: cli.py [-h] [-i INPUT] [-s STEPS] [-o OUTPUT_DIR]

    音频处理工具 - 将音视频内容转换为文字并进行智能总结

    示例用法:
    1. 处理视频文件(执行所有步骤):
        python cli.py -i video.mp4

    2. 处理音频文件并指定输出目录:
        python cli.py -i podcast.mp3 --output-dir my_summary

    3. 只执行音频预处理和语音转写:
        python cli.py -i lecture.wav --steps 12

    4. 从已有的转写文本开始处理:
        python cli.py -i transcript.txt --steps 34
        

optional arguments:
  -h, --help            show this help message and exit
  -i INPUT, --input INPUT
                        
                        输入文件路径。支持的格式:
                        - 视频文件:mp4, avi, mkv等
                        - 音频文件:mp3, wav, m4a等
                        - 文本文件:txt(仅用于步骤3和4)
                                              
  -s STEPS, --steps STEPS
                        
                        要执行的步骤(默认:1234):
                        1: 音频预处理 - 从视频/音频中提取音轨
                        2: 语音转写 - 将音频转换为文字
                        3: AI优化转写 - 优化文本的可读性
                        4: AI总结 - 生成多个维度的内容总结
                        注意:步骤必须按顺序执行,如"12"、"234"
                                              
  -o OUTPUT_DIR, --output-dir OUTPUT_DIR
                        
                        输出目录,用于存放处理结果(默认:output)
                        每个步骤的结果将保存在该目录下

3 常见问题

第三步、第四步调用AI失败

报错:

INFO:__main__:步骤3:开始AI文本修正润色
INFO:openai._base_client:Retrying request to /chat/completions in 0.467374 seconds
INFO:openai._base_client:Retrying request to /chat/completions in 0.459727 seconds
INFO:openai._base_client:Retrying request to /chat/completions in 0.995082 seconds
INFO:openai._base_client:Retrying request to /chat/completions in 0.829292 seconds
ERROR:src.ai_service:调用API时出错: Connection error.
ERROR:src.ai_service:调用API时出错: Connection error.
ERROR:__main__:AI文本修正润色失败

调用openai的库可能需要科学上网。需要在命令行中指定代理:

# Windows
set HTTP_PROXY=http://127.0.0.1:7897
set HTTPS_PROXY=http://127.0.0.1:7897

# *nix
export HTTP_PROXY=http://127.0.0.1:7897
export HTTPS_PROXY=http://127.0.0.1:7897

软件下载

夸克网盘分享

本文信息来源于GitHub作者地址:GitHub - RaidriarB/SummifyAI: 基于Whisper、deepseek的音视频转写+总结工具

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值