自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 声音波形及音量强度计算的理解与疑问

首先声明,写这个博客只是记录我的理解且仅限于我的理解,不一定正确,假设有错误的地方请指正.

2024-09-13 13:24:02 494

原创 根据需要编译FFMPEG动态库,缩小动态库的大小

安装完毕之后拉取Source Code ,source code上面放了两个链接,用哪個隨你下载你所需要的版本就行,我下载的是7.0.1.FFmpeg 提供了一系列编译参数,通过打开或关闭这些编译参数,就可以根据需要对FFmpeg进行定制化编译。我需要的功能是识别.wav音频文件的平均音量,只需要解封装、解码、过滤器就可以;下面的就是存储在.sh文件中的命令,直接在mingw64.exe执行该.sh文件就可以了.其实后面的步骤都大差不差,只不过我需要的ffmpeg的功能更少,所以生成的动态库更小;

2024-09-10 16:17:19 975

原创 WASAPI (Windows Audio Session API) 实现边播边录

边播边录是可以使用音频线将Microphone(麦克风)和Line-Out(喇叭)接在一起,然后执行该程式就能够将你所需要的播放的音频文件(我是用的是.wav音频文件)录制下来;同样Line-In(音频输入)和Line-Out(喇叭)也可以这样子操作;程式是能够运行,但是实际测试录制下来的音频文件声音大于原始音频文件且声音清晰度降低,由于我刚接触,所以对此部分也不太明白.如果想单独执行录制/播放的功能,在Main.cpp中将其中一个功能去掉即可,Code中已经做了录音和播放的分离。

2024-09-06 15:50:32 382

原创 CMake学习

参考笔记:参考教程:

2024-06-24 15:42:16 115

原创 Whisper.cpp 0基础搭建音频文件转文字(Windows下C++)

OpenAI的Whisper是一个自动语音识别(ASR)系统,经过大量多语言和多任务的监督数据训练,能够进行多语言语音识别、语音翻译和语言识别等任务。而whisper.cpp项目使得这个模型能够在不同的平台上以本地方式运行,包括但不限于Windows、Mac OS、Linux、Android和WebAssembly等。whisper.cpp不需要安装任何第三方的库或框架,只需要一个C/C++编译器就可以编译和运行,这减少了对外部库的依赖。

2024-06-17 16:34:11 2045

原创 关于PortAudio的使用前的准备--新手笔记

h文件在pa_stable_v190700_20210406\portaudio\include中,现在前提条件已经搞定了,后续你想使用的话直接将这三个文件复制到你的工程中引入就可以了。要想使用PortAudio,就需要先拿到PortAudio.h、PortAudio.lib、PortAudio.dll,这个需要去官网下载并编译,我是在VS2017下面编译的.我下载的是这个,下载之后解压文件并将整个文件拷贝到portaudio的目录下,并改名为ASIOSDK。C/C++—〉代码生成—〉运行库/MT。

2024-05-10 10:34:21 762

原创 DirectX诊断工具和PowerShell获取显存大小不一致问题

在PowerShell下面使用 Get-WmiObject Win32_VideoController 获取显存大小 : 2048MB。为什么两个获取的结果不一致,有没有大佬知道或者遇到过这个问题,为什么会导致这样?在DirectX诊断工具下获取显存大小 : 2007MB。

2024-03-01 10:10:26 291

CMake学习前面部分测试例子

CMake学习前面部分测试例子

2024-06-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除