Android通过JUV+Red5+Speex实现网络语音聊天(一)

最新推荐文章于 2019-12-13 16:25:15 发布

jingwen3699

最新推荐文章于 2019-12-13 16:25:15 发布

阅读量1.2w

点赞数 1

分类专栏：视频通话

视频通话专栏收录该内容

10 篇文章 0 订阅

订阅专栏

先说下实现原理,手机采集到语音后进过Speex编码，通过juv以直播形式发布自己的语音流到red5，也是通过juv播放对方的直播流，经过Speex解码后输出到扬声器，如下图：

Android端采集编码和解码播放Speex，参考android-recorder，至于他用的red5客户端，看了下，没看明白。。。
JUV这库吧好上手，虽然是付费的，但是有30天的试用，可长期申请。暂时用下也不错。另外，国内有破解版，你懂得。

核心代码如下：

public class AudioCenter extends AbstractMicrophone

首先，音频处理类继承自JUV库中的 AbstractMicrophone，便可以使用 fireOnAudioData方法向Red5服务端发布音频数据。

public void encSpeexAudio() {
  new Thread(new Runnable() {
 
	@Override
	public void run() {
	  int bufferSize = AudioRecord.getMinBufferSize(8000, AudioFormat.CHANNEL_IN_MONO, AudioFormat.ENCODING_PCM_16BIT);
	  short[] mAudioRecordBuffer = new short[bufferSize];
	  AudioRecord mAudioRecord = new AudioRecord(MediaRecorder.AudioSource.MIC, 8000, AudioFormat.CHANNEL_IN_MONO, AudioFormat.ENCODING_PCM_16BIT, bufferSize);
	  mAudioRecord.startRecording();
	  int bufferRead = 0;
	  int len;
	  isEncoding = true;
 
	  while (isEncoding) {
		bufferRead = mAudioRecord.read(mAudioRecordBuffer, 0, frameSize);
 
		if (bufferRead > 0) {
		  try {
			  len = speex.encode(mAudioRecordBuffer, 0, processedData, frameSize);
			  // LogHelper.d(subTAG, "EncSpeexAudio "+ len);
			byte[] speexData = new byte[len + 1];
			System.arraycopy(SpeexRtmpHead, 0, speexData, 0, 1);
			System.arraycopy(processedData, 0, speexData, 1, len);
			fireOnAudioData(new MediaDataByteArray(20, new ByteArray(speexData)));
		  } catch (Exception e) {
			e.printStackTrace();
		  }
		}
	  }
	  mAudioRecord.stop();
	  mAudioRecord.release();
	  mAudioRecord = null;
	}
  }, "EncSpeexAudio Thread").start();
}

以上是编码上传线程，一个关键技术点：SpeexRtmpHead,曾经困扰我很长一段时间，也是因为自己刚开始解除对RTMP协议只停留在api调用层面。

private byte[] SpeexRtmpHead = new byte[] { (byte) 0xB2 };

我们首先要知道“RTMP Packet中封装的音视频数据流，其实和FLV封装音频和视频数据的方式是相同的。”

Audio tag 数据区

audio信息	1byte	前四位bits表示音频格式:
		0 – 未压缩
		1 = ADPCM
		2 = MP3
		3 = Linear PCM, little endian
		4 = Nellymoser 16-kHz mono
		5 = Nellymoser 8-kHz mono
		6 = Nellymoser
		7 = G.711 A-law logarithmic PCM
		8 = G.711 mu-law logarithmic PCM
		9 = reserved
		10 = AAC
		11 = Speex
		14 = MP3 8-Khz
		15 = Device-specific sound
		下面两位bits表示samplerate:
		0 – 5.5kHz
		1 – 11kHz
		2 – 22kHz
		3 – 44kHz
		下面一位bit表示每个采样的长度：
		0 – snd8Bit
		1 – snd16Bit
		下面一位bit表示类型：
		0 – sndMomo
		1 – sndStereo
audio数据区	不定	if SoundFormat == 10 AACAUDIODATAelse Sound data—varies by format

由Flv协议的AudioTag数据区可查得，在数据区前有一个字节的audio信息，我们采用speex编码，8KHz采样，每个采样16bit，单声道。那么得出的数据为10110010 十六进制：0xB2,将它拼装到每个数据区前，通过fireOnAudioData发布，则为标准的Rtmp数据上传到服务器。这时候可以使用red5-publisher测试，已经能听到声音了。不清楚red5-publisher使用的朋友，可以看我上篇关于Red5的配置。

public void playSpeexAudio() {
  new Thread(new Runnable() {
	@Override
	public void run() {
	  short[] decData = new short[256];
	  AudioTrack audioTrack;
	  int bufferSizeInBytes = AudioTrack.getMinBufferSize(8000, AudioFormat.CHANNEL_OUT_MONO, AudioFormat.ENCODING_PCM_16BIT);
	  audioTrack = new AudioTrack(AudioManager.STREAM_VOICE_CALL, 8000, AudioFormat.CHANNEL_OUT_MONO, AudioFormat.ENCODING_PCM_16BIT, 2 * bufferSizeInBytes, AudioTrack.MODE_STREAM);
	  audioTrack.play();
	  isPlaying = true;
	  while (isPlaying) {
		while (encData.size() > 0) {
		  byte[] data = encData.elementAt(0);
		  encData.removeElementAt(0);
		  int dec;
			dec = speex.decode(data, decData, data.length);
			// LogHelper.d(subTAG, "playSpeexAudio "+ dec);
		  if (dec > 0) {
			audioTrack.write(decData, 0, dec);
		  }
		}
		try {
		  Thread.sleep(10);
		} catch (InterruptedException e) {
		  e.printStackTrace();
		}
 
	  }
	  audioTrack.stop();
	  audioTrack.release();
	  audioTrack = null;
 
	}
  }, "PlaySpeexAudio Thread").start();
}

以上为音频解码线程，没什么难点，只需注意我使用了一个Vector 来缓存juv拉下来的speex语音数据