一、实验要求
1.使用音频分析软件分析浊音、清音、爆破音的时域及频域特性。
2. 对down.rgb和down.yuv文件分析三个通道的概率分布,并计算各自的熵。
要求:两个文件的分辨率均为256*256.存储格式为RGB的文件按每个像素BGR分量依次存放;YUV格式为4:2:0采样空间,按照全部像素的Y数据块、U数据块和V数据块依次存放。
二、实验1结果
分析浊音、清音爆破音的时域及频域特性。
1、浊音/g/
2、清音/s/
3、爆破音/t/
总结
(1)时域:短时平均幅度浊音最大,清音居中,爆破音最低;短时过零率清音最大,爆破音居中,浊音最低。
(2)频域:浊音的低频能量较大,在300Hz左右处有峰值;清音高频能量较大,在20000Hz左右处有峰值;爆破音能量呈下降趋势,无明显峰值。
三、实验2结果
1、分析RGB文件的概率分布及熵
(1)代码
#include "iostream"
#include"stdio.h"
#include"math.h"
using namespace std;
int main()
{
//存放rgb分量和图像的值
unsigned char* r = new unsigned char[256*256];
unsigned char* g = new unsigned char[256*256];
unsigned char* b = new unsigned char[256*256];
unsigned char* img = new unsigned char[256*256*3];
//读取图像
FILE* fp = fopen("D:\\数据压缩作业\\down.rgb", "rb");
if (fp == NULL)
cout << "无法读取图像" << endl;
fread(img, sizeof(unsigned char), 256*256*3, fp);
fclose(fp);
//按每个像素b、g、r分量依次存放
for (int i = 0;i < 256*256; i++)
{
b[i] = img[3*i];
g[i] = img[3*i+1];
r[i] = img[3*i+2];
}
//计算rgb概率分布
double frer[256] = {
0},freg[256] = {
0},freb[256]