audfprint 开源项目使用教程
audfprintLandmark-based audio fingerprinting项目地址:https://gitcode.com/gh_mirrors/au/audfprint
1. 项目的目录结构及介绍
audfprint 项目的目录结构如下:
audfprint/
├── audfprint.py
├── audfprint_analyze.py
├── audfprint_match.py
├── audfprint_merge.py
├── audfprint_new.py
├── audfprint_query.py
├── audfprint_server.py
├── data/
├── defaults.py
├── docs/
├── LICENSE
├── models/
├── README.md
├── scripts/
├── setup.py
└── tests/
主要目录和文件介绍:
audfprint.py
: 主程序文件,用于指纹提取和匹配。audfprint_analyze.py
: 用于分析音频文件。audfprint_match.py
: 用于匹配音频文件。audfprint_merge.py
: 用于合并数据库。audfprint_new.py
: 用于创建新的数据库。audfprint_query.py
: 用于查询数据库。audfprint_server.py
: 用于启动服务器。data/
: 存储音频文件和数据库文件的目录。defaults.py
: 默认配置文件。docs/
: 文档目录。LICENSE
: 项目许可证。models/
: 存储模型文件的目录。README.md
: 项目说明文档。scripts/
: 脚本目录。setup.py
: 安装脚本。tests/
: 测试目录。
2. 项目的启动文件介绍
项目的启动文件是 audfprint.py
。该文件包含了主要的指纹提取和匹配功能。可以通过以下命令启动:
python audfprint.py
主要功能:
- 指纹提取:从音频文件中提取指纹。
- 指纹匹配:将提取的指纹与数据库中的指纹进行匹配。
3. 项目的配置文件介绍
项目的配置文件是 defaults.py
。该文件包含了项目的默认配置参数。
主要配置参数:
n_fft
: FFT 窗口大小。hop_size
: 帧移大小。fanout
: 指纹扩展因子。depth
: 指纹深度。shift
: 时间偏移。target_sr
: 目标采样率。max_len
: 最大音频长度。n_filters
: 滤波器数量。n_hop
: 跳数。sil_dB
: 静音阈值。min_dur
: 最小持续时间。max_alignments
: 最大对齐数。max_time_delta
: 最大时间差。max_tracks_per_artist
: 每个艺术家的最大曲目数。
通过修改 defaults.py
文件中的参数,可以调整项目的运行行为。
audfprintLandmark-based audio fingerprinting项目地址:https://gitcode.com/gh_mirrors/au/audfprint