Audio采样率相关计算


根据采样率计算buffer duration


audio buffer的时长和timestamp在知道采样率的情况下是可以直接计算的,这里假设采样率是44100,那么以微妙为单位,1秒等于1000000微妙,一个采样的时间计算出来就是22微妙,那么1024个采样就是22528,通常一个AAC frame通常就是1024个采样。

1 秒 采样率 = 1 个采样的时间长度 \frac{1秒}{采样率} = 1个采样的时间长度 采样率1=1个采样的时间长度
1 个采样的时长 × 1024 = 一个 b u f f e r 的时间长度 {1个采样的时长}\times {1024} = 一个buffer的时间长度 1个采样的时长×1024=一个buffer的时间长度

>>> 1000000/44100
22
>>> 22*1024
22528

整形计算的精度损失


如果以纳秒为单位,1秒等于1000000000纳秒 ,一个采样的时间就是22675纳秒,1024个采样就是23219200纳秒,换成微秒就是23219微秒,这样一个Audio buffer计算时间ts和duration的时候就损失691微妙,这样在经过一段时间之后,体现在av同步上就出问题了。

>>> 1000000000/44100
22675
>>> 22675*1024
23219200

📣 所以在计算的时候要特别小心使用的时间单位是否满足需求。


如果以纳秒为单位,1秒等于1000000000纳秒 ,一个采样的时间就是22675纳秒,1024个采样就是23219200纳秒,换成微秒就是23219微秒,这样一个Audio buffer计算时间ts和duration的时候就损失691微妙,这样在经过一段时间之后,体现在av同步上就出问题了。

>>> 1000000000/44100
22675
>>> 22675*1024
23219200

根据buffer大小计算audio的duration

如何计算一个buffer的采样数,因为:

s a m p l e s = b u f f e r 总字节数 每个 s a m p l e 的字节数 samples = \frac{buffer总字节数}{每个sample的字节数} samples=每个sample的字节数buffer总字节数

假设buffer大小是4096个字节,2声道16bit采样,一个采样就是4个字节,那么4096个字节就是1024个采样:

>>> 4096/4
1024

如果采样率是44100,那么这个buffer的时长就是23219.95微秒,这里1秒等于1000000.0微秒:

>>> 1000000.0/44100*1024
23219.954648526076

如果采样率是48000,那么这个buffer的时长就是21333.33微秒,这里1秒等于1000000.0微秒:

>>> 1000000.0/48000*1024
21333.333333333332
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下关于多媒体技术的描述中,错误的选项是多媒体技术就是能用来观看的数字电影技 术。 以下硬件设备中,不是多媒体硬件系统必须包括的是多媒体通信传输设备。 以下设备中,不属于音频设备的是DV卡。 以下对多媒体计算机的描述中,较为全面的一项为哪一项带有高公辨率显示设备的、具 有大容量内存和硬盘的,包含功能强大中央处理器〔CPU〕的, 并具有音视频处理功能的计算机。 以下接口中,一般不能用于连接扫描仪的是VGA接口。 以下设备中,不是多媒体计算机中常用的图像输入设备的是条码读写器。 下面功能中,不属于MPC对图形、图像处理能力的根本要求的是实现三维动画。 下面的多媒体软件工具中,由windows自带的是Media Player. 以下对视频设备的描述中,正确的选项是视频采集卡的功能是用于采集音频数据。 以下对音频格式文件的描述中,正确的选项是MIDI文件很小,但MIDI文件不能被录制, 必须使用特殊的硬件和软件在计算机上合成。 以下对音频格式文件的描述中,正确的选项是.mp3格式谇不必等待整个文件下载完成即 可收听该文件。 以下软件中,不属于音频播放软件的是Premiere. 以下软件中,不属于视频播放软件的是Winamp. Windows media player 不支持的文件格式是RMVB. 以下关于文件压缩的描述中,错误的选项是使用文件压缩工具可以将JPG图像文件压缩7 0%左右。 以下关于WinRAR的描述中,错误的选项是使用WinRAR进行解压缩时,必须一次性解压缩 包中的所有文件,而不能解压缩其中的个别文件。 以下选项中,不是常用的多媒体信息压缩标准的是lWZ压缩。 以下格式中,不属于音频文件格式的是MOV格式。 以下工具中,不属于多媒体创作工具的是Authorware. 以下格式中,不属于视频文件格式的是MID格式。 以下对音频格式文件的描述中,正确的选项是Real Audio格式压缩品质格式,它能使声音文件明显缩小,其声音品质较差。 以下对视频格式文件的描述中,不正确的选项是.avi格式可以将视频和音频交织在一起 进行同步播放,而且体积非常小。 以下对视频格式文件的描述中,不正确的选项是.mpeg、.mpg或.dat格式被用于家用的V CD、SVCD、DVD. 以下对视频格式文件的描述中,不正确的选项是.ra、.rm或.rmvb格式是windows公司开 发的一种静态图像文件格式。 以下关于多媒体技术的集成特性的说法中,正确是指多种媒体综合使用的特性。 一台典型的多媒体计算机的硬件不必须包括扫描仪。 以下选项中,不属于计算机多媒体功能的是自动扫描。 以下应用领域中,属于计算机多媒体应用的是音、视频会议系统。 把一台普通的计算机变成多媒体计算机,要解决的关键技术不包括网络包分发技术。 以下关于多媒体技术的描述中,错误的选项是多媒体技术可以不进行数模转化,直接压 缩模拟音乐。 音频设备是音频输入输出设备的交总称,以下包括正确的选项是中高频音箱、话筒、PC 中的声卡、耳机、多媒体控制台、数字调音台、功放机、音箱音频采样卡、合成器。 以下对音频设备的描述中,正确的选项是功放机是用于把来自信号源的微弱电信号进行 放大的设备。 只读光盘CD-ROM属于存储媒体。 默认启动"windows media player 〞的方法是单击"程序〞 "附件〞 "娱乐〞 windows media player 以下有关DVD光盘与VCD光盘的描述中,正确的选项是DVD光盘的记录容量比VCD光盘大。 以下对视频设备的描述中,不正确的选项是用于在PC上处理视频信号的声卡。 以下对视频设备的描述中,不正确的选项是音频卡用于对摄像头或者摄像机等信号进行 捕捉、并以MPEG格式存储在硬盘上。 以下对视频设备的描述中,正确的选项是视频卡主要用于捕捉、数字化、冻结、存储、 输出、放大、缩小和调整来自激光视盘机、录像机或摄像机的图像。 以下对音频、视频设备的描述中,不正确的选项是视频设备既可采集音频信号,也可播 放音频信号。 以下对音频、视频设备的描述中,不正确的选项是"媒体播放器〞只可以播放音频文件, 不能播放视频文件。 以下对音频文件夹格式的描述中,正确的选项是MIDI文件通常比WAV文件小,可以从CD、 磁带、麦克风等录制WAV文件。 常见的多媒体创作工具不包括windows media player。 .mpeg、.mpg或.dat格式是运动图像专家组〔MPEG〕格式,采用这种格式的家用设备不包 括收音机。 Real Networds公司开发的一种新型流式视频文件格式,可用来在低速率的广域网上实时传输 活动视频影像,实现影像数据的实时传送和实时播放,它的格式包括.rmvb。 以下选项中,最常用的三维动画制作软件工具是3DMAX. 以下选项中,不属于音
Audio-Fingerprinting 是一个音乐指纹识别系统,使用的语言为 JAVA,同时需要用到 MySQL 数据库(虽然不是必须的,但这个系统采用他保存指纹和音乐信息)。他包含了指纹生成,数据库存储,和简易的服务器和客户端。他通过生成和记录音乐指纹,能够识别来自麦克风、文件等各个来源的音乐,并且有很高的抗噪性,同时他对文件属性和音乐质量不敏感。你可以使用服务器给手机或者其他程序提供音乐识别服务。你可以根据需求调节里面的参数,当前参数是为了在较短时间识别来自极大噪声和失真的音源,1500个左右的文件将产生接近24000000个指纹数 据。如果你只用于识别文件并且没有严重的噪声与失真,你可以修改参数,1个文件只需要少量指纹就可以识别,对于噪声较低的音源10s 200个指纹已经满足大多需求。简易使用方法需要安装MySQL,并执行Fingerprint. sql, 同时你可能需要修改max_allowed_packet参数,因为添加歌曲需要发送较大的包,我采用的参数是32M。修改MysqlDB中的数据库信息为你的数据库信息,如:private final String url = "jdbc:mysql://127.0.0.1:3306/musiclibary?user=yecheng"; private final String user = "yecheng"; private final String password = "yecheng";添加文件的方法:Ps:你可以重写添加的方法或者制作脚本或者直接使用其他软件实现转码功能,目前他能够从%title%}}%album%}}%artist%的文件名中获得信息。将文件转码为WAV,采样率为8000。调用Insert,参数为文件名或者文件夹。搜索音乐你可以调用Search 文件名搜索。在数据库较大的情况推荐采用运行Server,使用Client 文件名搜索。主要参数介绍Fingerprint:NPeaks:一个周期中每个子带的峰值点的个数 fftSize:FFT的窗口大小 overlap:FFT的窗口重叠大小 C:一个周期包含多少个窗口 peakRange:取峰值点时与多大范围的邻居比较 range_time:取点对的时候的时间范围,单位为秒 range_freq:取点对的时候的频率范围,单位为频率 Band:分成的子带,值对应FFT产生的数组索引 minFreq:最小频率 maxFreq:最大频率 minPower:最小能量修改的建议:提高识别率:减小minPower, 增加Band、NPeaks、range_time降低数据量:增大minPower,减小Band、NPeaks、rang_time其中建议先修改Band和minPower。Server:port:服务器的端口Client:ip:服务器的ip port:服务器的端口性能与效果数据量:音乐库为1500首歌,指纹数量为24000000个左右,服务器稳定后占用内存约340M。速度:处理器i7-3632QM,添加1500首歌用时约1919秒,一首歌约用时1.3秒。使用服务器查找10s的歌曲用时约0.2秒(不考虑客户端读取文件的时间)。准确度:对噪声较低的音频有很高的识别率,对噪声较高的也有接近商用的准确率,但是相对来说如果对于未出现在曲库的歌曲,也有一定的误报率。抗噪性:能够抵抗较强的失真和噪声,可以参考我给的测试音频。工作原理参考文档:ShazamMel scale本算法实现类似Shazam,首先我计算音频的频谱图,将频谱根据频率分成若干子带,对每个子带查找若干个峰值点,本算法子带划分基于Mel频率。将获得的峰值点根据频率、时间范围组成点对。本算法的取点对频率范围为在子带内,其目的在于减少点对的数目并且提高分布式能力。取点对的时间范围为1s-4s。你可以根据需要修改这些参数。 标签:Audio
以下关于多媒体技术的描述中,错误的是多媒体技术就是能用来观看的数字电影技术。 以下硬件设备中,不是多媒体硬件系统必须包括的是多媒体通信传输设备。 以下设备中,不属于音频设备的是DV卡。 下列对多媒体计算机的描述中,较为全面的一项是带有高公辨率显示设备的、具有大容量 内存和硬盘的,包含功能强大中央处理器〔CPU的, 并具有音视频处理功能的计算机。 以下接口中,一般不能用于连接扫描仪的是VGA接口。 以下设备中,不是多媒体计算机中常用的图像输入设备的是条码读写器。 下面功能中,不属于MPC对图形、图像处理能力的基本要求的是实现三维动画。 下面的多媒体软件工具中,由windows自带的是Media Player. 以下对视频设备的描述中,正确的是视频采集卡的功能是用于采集音频数据。 以下对音频格式文件的描述中,正确的是MIDI文件很小,但MIDI文件不能被录制,必须使用 特殊的硬件和软件在计算机上合成。 以下对音频格式文件的描述中,正确的是.mp3格式谇不必等待整个文件下载完成即可收听 该文件。 以下软件中,不属于音频播放软件的是Premiere. 以下软件中,不属于视频播放软件的是Winamp. Windows media player 不支持的文件格式是RMVB. 以下关于文件压缩的描述中,错误的是使用文件压缩工具可以将JPG图像文件压缩70%左右 。 以下关于WinRAR的描述中,错误的是使用WinRAR进行解压缩时,必须一次性解压缩包中的 所有文件,而不能解压缩其中的个别文件。 以下选项中,不是常用的多媒体信息压缩标准的是lWZ压缩。 以下格式中,不属于音频文件格式的是MOV格式。 以下工具中,不属于多媒体创作工具的是Authorware. 以下格式中,不属于视频文件格式的是MID格式。 以下对音频格式文件的描述中,正确的是Real Audio格式压缩品质格式,它能使声音文件明显缩小,其声音品质较差。 以下对视频格式文件的描述中,不正确的是.avi格式可以将视频和音频交织在一起进行同 步播放,而且体积非常小。 以下对视频格式文件的描述中,不正确的是.mpeg、.mpg或.dat格式被用于家用的VCD、S VCD、DVD. 以下对视频格式文件的描述中,不正确的是.ra、.rm或.rmvb格式是windows公司开发的一 种静态图像文件格式。 以下关于多媒体技术的集成特性的说法中,正确是指多种媒体综合使用的特性。 一台典型的多媒体计算机的硬件不必须包括扫描仪。 下列选项中,不属于计算机多媒体功能的是自动扫描。 以下应用领域中,属于计算机多媒体应用的是音、视频会议系统。 把一台普通的计算机变成多媒体计算机,要解决的关键技术不包括网络包分发技术。 以下关于多媒体技术的描述中,错误的是多媒体技术可以不进行数模转化,直接压缩模拟 音乐。 音频设备是音频输入输出设备的交总称,以下包括正确的选项是中高频音箱、话筒、PC中 的声卡、耳机、多媒体控制台、数字调音台、功放机、音箱音频采样卡、合成器。 以下对音频设备的描述中,正确的是功放机是用于把来自信号源的微弱电信号进行放大的 设备。 只读光盘CD-ROM属于存储媒体。 默认启动"windows media player "的方法是单击"程序" "附件" "娱乐" windows media player 下列有关DVD光盘与VCD光盘的描述中,正确的是DVD光盘的记录容量比VCD光盘大。 以下对视频设备的描述中,不正确的是用于在PC上处理视频信号的声卡。 以下对视频设备的描述中,不正确的是音频卡用于对摄像头或者摄像机等信号进行捕捉、 并以MPEG格式存储在硬盘上。 以下对视频设备的描述中,正确的是视频卡主要用于捕捉、数字化、冻结、存储、输出、 放大、缩小和调整来自激光视盘机、录像机或摄像机的图像。 以下对音频、视频设备的描述中,不正确的是视频设备既可采集音频信号,也可播放音频 信号。 以下对音频、视频设备的描述中,不正确的是"媒体播放器"只可以播放音频文件,不能播 放视频文件。 以下对音频文件夹格式的描述中,正确的是MIDI文件通常比WAV文件小,可以从CD、磁带、 麦克风等录制WAV文件。 常见的多媒体创作工具不包括windows media player。 .mpeg、.mpg或.dat格式是运动图像专家组〔MPEG格式,采用这种格式的家用设备不包括 收音机。 Real Networds公司开发的一种新型流式视频文件格式,可用来在低速率的广域网上实时传输活 动视频影像,实现影像数据的实时传送和实时播放,它的格式包括.rmvb。 下列选项中,最常用的三维动画制作软件工具是3DMAX. 下列选项中,不属于音频播放软件是Dreamweaver。 Windows自带的媒体播放机windows me

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值