音频编码之opus(一)

最近项目中用到了语音编码opus,在网上搜了一下,资料非常少,而且没有一个完整的教程,现在简单记录下来opus的使用方法。


首先介绍一下opus


Opus

Opus编码器 是一个有损声音编码的格式,由互联网工程任务组(IETF)进来开发,适用于网络上的实时声音传输,标准格式为RFC 6716。Opus 格式是一个开放格式,使用上没有任何专利或限制。

特性

Opus的前身是celt编码器。在当今的有损音频格式争夺上,拥有众多不同编码器的AAC格式打败了同样颇有潜力的Musepack、Vorbis等格式,而在Opus格式诞生后,情况似乎不同了。通过诸多的对比测试,低码率下Opsu完胜曾经优势明显的HE AAC,中码率就已经可以媲敌码率高出30%左右的AAC格式,而高码率下更接近原始音频。

以上来自百度百科(PS:百度百科对opus的介绍都很少)


简单来说,opus是一个高保真的适合在网络中传输的开源的语音编码格式,相对于其他编码格式来讲,保真性更好,但体积会稍微大一些。官网地址:http://www.opus-codec.org/


怎么用呢?

首先你可以使用编译好的so库直接使用,或者也可以使用源码自己根据需求生成so库来使用,当然,你也可以直接将源码使用到自己工程各中,这就是开源的好处。好了下面介绍如何编译。

我是通过Eclipse来编译的,首先在opus官网下载源代码,解压。

编码工作需要ndk编程所以需要一些NDK编程的知识。

在工程中创建OpusTool类,该类用于调用native层的方法。

package com.ione.opustool;

public class OpusTool {

	public native String nativeGetString();

	public native int encode_wav_file(String in_path, String out_path);

	public native int decode_opus_file(String in_path, String out_path);
}

其中nativeGetString()方法是用来测试jni调用是否成功的测试方法,encode_wav_file(String in_path, String out_path);和 decode_opus_file(String in_path, String out_path);分别是用来编解码。以上三个方法均需声明为native,用来调用jni的c函数。然后在项目根目录下打开命令行,使用javah命令生成.h文件,即:

javah -classpath .\bin\classes -d jni com.ione.opustool.OpusTool

其中.\bin\classes为指定OpusTool.class的路径,-d jni为在当前目录下生成jni文件夹,用来存放native层代码。回车之后便在工程的根目录下生成了jni文件夹以及com_ione_opustool_OpusTool.h文件。如:




/* DO NOT EDIT THIS FILE - it is machine generated */
#include <jni.h>
/* Header for class com_ione_opustool_OpusTool */

#ifndef _Included_com_ione_opustool_OpusTool
#define _Included_com_ione_opustool_OpusTool
#ifdef __cplusplus
extern "C" {
#endif
/*
 * Class:     com_ione_opustool_OpusTool
 * Method:    nativeGetString
 * Signature: ()Ljava/lang/String;
 */
JNIEXPORT jstring JNICALL Java_com_ione_opustool_OpusTool_nativeGetString
  (JNIEnv *, jobject);

/*
 * Class:     com_ione_opustool_OpusTool
 * Method:    encode_wav_file
 * Signature: (Ljava/lang/String;Ljava/lang/String;)I
 */
JNIEXPORT jint JNICALL Java_com_ione_opustool_OpusTool_encode_1wav_1file
  (JNIEnv *, jobject, jstring, jstring);

/*
 * Class:     com_ione_opustool_OpusTool
 * Method:    decode_opus_file
 * Signature: (Ljava/lang/String;Ljava/lang/String;)I
 */
JNIEXPORT jint JNICALL Java_com_ione_opustool_OpusTool_decode_1opus_1file
  (JNIEnv *, jobject, jstring, jstring);

#ifdef __cplusplus
}
#endif
#endif

接下来复制一份 com_ione_opustool_OpusTool.h文件到jni目录,修改名称为com_ione_opustool_OpusTool.c修改内容为:

#include <com_ione_opustool_OpusTool.h>

JNIEXPORT jstring JNICALL Java_com_ione_opustool_OpusTool_nativeGetString
                   JNIEnv * env, jobject obj) {
	return (*env)->NewStringUTF(env, "Hello Opus");
}

JNIEXPORT jint JNICALL Java_com_ione_opustool_OpusTool_encode_1wav_1file(
		JNIEnv *env, jobject obj, jstring wav_path, jstring opus_path) {
	return 0;
}

JNIEXPORT jint JNICALL Java_com_ione_opustool_OpusTool_decode_1opus_1file(
		JNIEnv *env, jobject obj, jstring wav_path, jstring opus_path) {
	return 0;
}
然后创建并配置makefile和android.mk文件,后面会给出。记得配置NDK_Builder。
此时可以调用 OpusTool类的nativeGetString()方法查看返回数据是否正常,若为Hello Opus 则jni调用成功。可以继续下面的工作。

在jni目录下创建libopus文件夹,将Opus源码粘贴到该文件夹下,即celt、include、silk、src文件夹以及config文件,当然不是所有的文件都用的上,可以根据自记得需求进行拷贝。配置好makefile等配置文件后即可编译工程,如果编译顺利,则说明配置文件没有问题,继续操作。在src文件加下创建opus_tool.c文件用来进行音频文件的编解码的c实现。

opus_tool.c

/*****************************************************************************
 # -*- coding:utf-8 -*-
 # author: ione
 # create date: 2014-11-27
 *****************************************************************************/
#include "android_log.h"
#include "opus.h"
#include "opus_types.h"
#include "opus_multistream.h"

#define SAMPLE_RATE 16000
#define CHANNEL_NUM 1
#define BIT_RATE 16000
#define BIT_PER_SAMPLE 16
#define WB_FRAME_SIZE 320
#define DATA_SIZE 1024 * 1024 * 4

int encode(char* in, int len, unsigned char* opus, int* opus_len) {
	int err = 0;
	opus_int32 skip = 0;

	OpusEncoder *enc = opus_encoder_create(SAMPLE_RATE, CHANNEL_NUM,
			OPUS_APPLICATION_VOIP, &err);
	if (err != OPUS_OK) {
		fprintf(stderr, "cannnot create opus encoder: %s\n",
				opus_strerror(err));
		enc = NULL;
		return -1;
	}

	opus_encoder_ctl(enc, OPUS_SET_BANDWIDTH(OPUS_BANDWIDTH_WIDEBAND));
	opus_encoder_ctl(enc, OPUS_SET_BITRATE(BIT_RATE));
	opus_encoder_ctl(enc, OPUS_SET_VBR(1));
	opus_encoder_ctl(enc, OPUS_SET_COMPLEXITY(10));
	opus_encoder_ctl(enc, OPUS_SET_INBAND_FEC(0));
	opus_encoder_ctl(enc, OPUS_SET_FORCE_CHANNELS(OPUS_AUTO));
	opus_encoder_ctl(enc, OPUS_SET_DTX(0));
	opus_encoder_ctl(enc, OPUS_SET_PACKET_LOSS_PERC(0));
	opus_encoder_ctl(enc, OPUS_GET_LOOKAHEAD(&skip));
	opus_encoder_ctl(enc, OPUS_SET_LSB_DEPTH(16));

	short frame_size = WB_FRAME_SIZE;
	int frame_bytes = (frame_size << 1);

	opus_int16 *frame = (opus_int16 *) in;
	unsigned char *cbits = opus;

	while (len > frame_bytes) {
		int nbytes = opus_encode(enc, frame, frame_size, cbits + sizeof(char),
				640 - sizeof(short));
		if (nbytes > frame_size * 2 || nbytes < 0) {
			return -1;
		}
		cbits[0] = nbytes;
		frame += WB_FRAME_SIZE;
		cbits += nbytes + sizeof(char);
		len -= frame_bytes;
		*opus_len += nbytes + sizeof(char);
	}
	opus_encoder_destroy(enc);
	return 0;
}

int decode(unsigned char* in, int len, short* out, int* out_len) {
	int err = 0;
	opus_int32 skip = 0;
	*out_len = 0;

	OpusDecoder *dec = opus_decoder_create(SAMPLE_RATE, 1, &err);
	if (err != OPUS_OK) {
		fprintf(stderr, "cannnot decode opus: %s\n", opus_strerror(err));
		dec = NULL;
		return -1;
	}

	short frame_size = WB_FRAME_SIZE;

	opus_int16 *frame = (opus_int16 *) in;

	while (len > 0) {
		int nbytes = in[0];
		if (nbytes <= 0) {
			return -1;
		}
		int decode_len = opus_decode(dec, in + sizeof(char), nbytes, out,
				frame_size, 0);
		if (decode_len != frame_size) {
			return -1;
		}

		in += sizeof(char) + nbytes;
		out += frame_size;
		len -= nbytes - sizeof(char);
		*out_len += frame_size;
	}
	opus_decoder_destroy(dec);
	return 0;
}

int encode_wav_file(char *in_file_path, char *out_file_path) {
	FILE *fin = fopen(in_file_path, "rb");

	if (fin == NULL || fin == 0) {
		return -1;
	}
	char *in = (char*) malloc(DATA_SIZE);
	memset(in, 0, DATA_SIZE);
	int len = fread(in, 1, DATA_SIZE, fin);
	if (len == 0) {
		return -1;
	}
	FILE *fout = fopen(out_file_path, "wb");

	if (fout == NULL || fout == 0) {
		return -1;
	}

	unsigned char *out = (unsigned char*) malloc(DATA_SIZE);
	memset(out, 0, DATA_SIZE);
	int out_len = 0;
	encode(in, len, out, &out_len);
	if (len < 0) {
		return -1;
	}
	fwrite(out, 1, out_len * sizeof(unsigned char), fout);

	free(in);
	free(out);
	fclose(fin);
	fclose(fout);
	return len;
}

int make_wav_header(FILE *out, int len) {
	int size = 0;
	int *sz = &size;
	int number;
	int * nm = &number;

	// RIFF  4 bytes
	fseek(out, 0, SEEK_SET);
	fputs("RIFF", out);

	// len   4 bytes
	len = (len + 44 - 8);
	fwrite(&len, 2, 1, out);
	number = 0;
	fwrite(nm, 2, 1, out);

	// WAVE  4 bytes  + "fmt " 4 bytes
	fputs("WAVEfmt ", out);

	// size1   4 bytes
	number = 16;
	fwrite(nm, 2, 1, out);
	number = 0;
	fwrite(nm, 2, 1, out);

	// format tag       2 bytes
	number = 1;
	fwrite(nm, 2, 1, out);

	// channel    2 bytes
	number = CHANNEL_NUM;
	fwrite(nm, 2, 1, out);

	// sample rate          4 bytes
	number = SAMPLE_RATE;
	fwrite(nm, 2, 1, out);
	number = 0;
	fwrite(nm, 2, 1, out);

	//byte per seconds   4 bytes
	number = 22664;
	fwrite(nm, 2, 1, out);
	number = 0;
	fwrite(nm, 2, 1, out);

	// block align   2 bytes
	number = CHANNEL_NUM * BIT_PER_SAMPLE / 8;
	fwrite(nm, 2, 1, out);

	// bitPerSample   2 bytes
	number = 16;
	fwrite(nm, 2, 1, out);

	// "data"      4 bytes
	fputs("data", out);

	// size2    4 bytes
	size = (size - 36);
	fwrite(sz, 2, 1, out);
	number = 0;
	fwrite(nm, 2, 1, out);

	return 0;
}

int decode_opus_file(char *in_file_path, char *out_file_path) {
	printf("%s\n", in_file_path);
	FILE *fin = fopen(in_file_path, "rb");
	if (fin == NULL || fin == 0) {
		return -1;
	}
	unsigned char *in = (unsigned char *) malloc(DATA_SIZE);
	memset(in, 0, DATA_SIZE);
	int len = fread(in, 1, DATA_SIZE, fin);

	FILE *fout = fopen(out_file_path, "wb");
	if (fout == NULL || fout == 0) {
		return -1;
	}
	short *out = (short *) malloc(DATA_SIZE);
	memset(out, 0, DATA_SIZE);

	int out_len = 0;
	out += 44;
	decode(in, len, (short *) out, &out_len);
	if (len < 0) {
		return -1;
	}
	fwrite(out, 1, out_len * sizeof(short), fout);
	int err = make_wav_header(fout, out_len);

	free(in);
	free(out);
	fclose(fin);
	fclose(fout);
	return out_len;
}
配置makefile文件添加opus_tool.c文件,然后编译,即可在libs目录下生成.so文件


至此,native层操作已经完成,so库也已经通过编译得到。

下一篇将会介绍如何使用该so库。

音频编码之opus(二)




  • 7
    点赞
  • 59
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值