上篇文章 介绍了数字音频的基础知识,这篇文章我们来看看代码应该怎么写:
录音PCM 第一步我们先用AudioRecord录制PCM音频:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 private lateinit var buffer: ByteArray fun start(audioSource: Int, sampleRate: Int, channelConfig: Int, audioFormat: Int): Boolean { ... val bufferSize = AudioRecord.getMinBufferSize(sampleRate, channelConfig, audioFormat) buffer = ByteArray(bufferSize) recorder = AudioRecord(audioSource, sampleRate, channelConfig, audioFormat, bufferSize) recorderThread = RecordThread() recorderThread?.start() return true } inner class RecordThread : Thread() { override fun run() { super.run() var readLen: Int recorder?.startRecording() while (recorder?.recordingState == AudioRecord.RECORDSTATE_RECORDING) { readLen = recorder?.read(buffer, 0, buffer.size) ?: break listener.onRecord(buffer, readLen) } recorder = null } }
可以看到AudioRecord的使用很简单,就是创建一个AudioRecord对象然后在子线程中不断地read就好,audioSource指的是通过哪个设备录音,其他的几个参数在基础部分都有讲过,就不过多介绍了:
1 2 3 4 5 6 private const val AUDIO_SOURCE = MediaRecorder.AudioSource.MIC private const val SAMPLE_RATE = 44100 private const val AUDIO_FORMAT = AudioFormat.ENCODING_PCM_16BIT private const val CHANNEL_CONFIG = AudioFormat.CHANNEL_IN_MONO // 单通道 //private const val CHANNEL_CONFIG = AudioFormat.CHANNEL_IN_STEREO // 双通道 recorder.start(AUDIO_SOURCE, SAMPLE_RATE, CHANNEL_CONFIG, AUDIO_FORMAT)
当然,记得需要申请录音权限:
1 <uses-permission android:name="android.permission.RECORD_AUDIO" />
使用LAME进行MP3编码 得到PCM裸流之后我们就需要对他进行MP3编码,LAME就是一个开源的MP3音频压缩软件,也是公认有损MP3中压缩效果最好的编码器。
编译 使用LAME需要自行编译出静态库,首先我们从LAME的官网 下载最新版本的LAME源码。从源码文件目录结构中可以看出它使用AutoMake编译,之前写过几篇AutoMake的学习笔记 ,感兴趣的同学可以看看。
或者也可以直接修改Demo工程的build-lame.sh 。修改开头的NDK路径、安卓版本、abi这几个参数接口直接运行在output目录生成出.a文件和.h文件:
1 2 3 4 5 6 7 #!/bin/zsh NDK_ROOT=/Users/linjw/Library/Android/sdk/ndk/22.1.7171670 ANDROID_API_VERSION=21 NDK_TOOLCHAIN_ABI_VERSION=4.9 ABIS=(armeabi armeabi-v7a arm64-v8a x86 x86_64) ...
导入AndroidStudio 得到静态库之后在CMake中导入静态库:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 cmake_minimum_required(VERSION 3.18.1) project("lame") add_library( lame SHARED native-lib.cpp) # 导入lame头文件 include_directories(${CMAKE_SOURCE_DIR}/include) #导入lame静态库 add_library(mp3lame STATIC IMPORTED) set_target_properties( mp3lame PROPERTIES IMPORTED_LOCATION ${CMAKE_SOURCE_DIR}/../../../jniLibs/${ANDROID_ABI}/libmp3lame.a) find_library( log-lib log) target_link_libraries( lame mp3lame # 链接lame静态库 ${log-lib})
lame基本使用 初始化 在了解了MP3的基础知识之后其实很容易上手lame。
第一步无非就是一些音频参数的初始化设置:
1 2 3 4 5 6 7 8 9 10 第一步: 创建lame_global_flags* lame_global_flags *client = lame_init(); 第二步: 配置参数 lame_set_in_samplerate(client, 44100); // 输入采样率 lame_set_out_samplerate(client, 44100); // 输出采样率44100 lame_set_num_channels(client, 2); // 通道数2 lame_set_brate(client, 128); // 比特率128kbps lame_set_quality(client, 2); // 编码质量2 lame_init_params(client); // 初始化参数
编码质量 上面的参数大部分都在前一篇介绍过了,只剩一个编码质量没讲过,他其实是用来选择压缩算法的。算法编号从0到9,0音质最好但是算法最复杂也最耗时,9音质最差但算法效率最高。一般会选择2。
比特率和压缩算法都能决定MP3的音质。压缩前的PCM裸流音质最好,大小最大。
由于MP3的大小等于比特率乘时长,压缩后的MP3比特率越大,那么它的大小就越大,就越接近压缩前的PCM,损失的信息也就越少,解压之后就越接近原本的PCM的曲线,音质自然就越好。
而选择压缩算法的意义在于,在相同比特率的情况下( MP3文件大小相同),好的压缩算法解压出来的声音曲线能更接近原本的PCM曲线,但是相应的它的计算量就会更大。
可以说选择大的比特率是用存储空间换音质,而选择音质高的压缩算法则是用cpu资源换音质。
MP3编码 配置好初始化参数之后就只要将PCM数据传递给LAME进行压缩即可,这里有几种PCM的传递方式:
1. 左右通道分开输入
双通道立体声,有时候左右通道的数据会放在不同的文件里面,可以使用下面的方法去编码MP3:
1 2 3 4 5 6 7 int CDECL lame_encode_buffer ( lame_global_flags* gfp, /* global context handle */ const short int buffer_l [], /* PCM data for left channel */ const short int buffer_r [], /* PCM data for right channel */ const int nsamples, /* number of samples per channel */ unsigned char* mp3buf, /* pointer to encoded MP3 stream */ const int mp3buf_size ); /* number of valid octets in this stream */
gfp : lame_init返回的lame_global_flags*
buffer_l : 左通道数据
buffer_r : 右通道数据
nsamples : 每个通道的采样点数量。例如当AudioFormat为16bit的时候, 一个采样点大小为2byte, 则nsamples = buffer_l有效数据长度(byte) / 2
mp3buf : 编码后的MP3会存放到这里
mp3buf_size : mp3buf的大小,它可以通过采样率、比特率和前面的nsamples计算出来,不过LAME提供了一个最大buffer大小计算的简单算法(1.25*nsamples + 7200 byte)
他的返回值如下:
>=0 : 编码后的MP3数据的大小,即存储到mp3buf的MP3音频的byte数
-1 : mp3buf的大小太小
-2 : malloc()方法出现问题
-3 : lame_init_params()没有调用
-4 : 音频数据异常
参考代码:
1 int encodeSize = lame_encode_buffer_interleaved(client, pcm, numSamples, result, resultSize);
2. 单通道输入
有时候我们的数据只会有一个通道的数据,例如AudioRecord的ChannelConfig配置成AudioFormat.CHANNEL_IN_MONO。
这个时候我们只需要把right输入设置成NULL即可:
1 int encodeSize = lame_encode_buffer(client, left, null, numSamples, result, resultSize);
3. 多通道混合输入
当AudioRecord的ChannelConfig配置成AudioFormat.CHANNEL_IN_STEREO。左右声道的数据会交叉存储在PCM裸流中。或者其他更多通道混合输入的时候我们可以用lame_encode_buffer_interleaved方法进行编码:
1 2 3 4 5 6 int CDECL lame_encode_buffer_interleaved( lame_global_flags* gfp, /* global context handlei */ short int pcm[], /* PCM data for left and right channel, interleaved */ int num_samples, /* number of samples per channel, _not_ number of samples in pcm [] */ unsigned char* mp3buf, /* pointer to encoded MP3 stream */ int mp3buf_size ); /* number of valid octets in this stream */
指的注意的是,这里的num_samples指的是每个通道的采样点数,而不是所有通道的采样点数之和。
例如当AudioFormat为16bit、双通道输入的时候, 一个采样点大小为2byte, 则
nsamples = buffer_l有效数据长度(byte) / 2(16bite为2byte) / 2(通道数为2)
1 int encodeSize = lame_encode_buffer_interleaved(client, pcm, numSamples, result, resultSize);
清理工作 当编码结束之后我们可以用lame_close方法进行清理:
结合JNI进行使用 由于LAEM的使用需要保存lame_global_flags,我们可以将它强转成long传到java进行保存,在需要的时候再讲传入的long强转回lame_global_flags :
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 class LameMp3 { private var lameClientPtr: Long = createLameMp3Client() fun destroy(): Int { val ret = close(lameClientPtr) lameClientPtr = 0 return ret } ... private external fun createLameMp3Client(): Long private external fun close(client: Long): Int ... } extern "C" JNIEXPORT jlong JNICALL Java_me_linjw_lib_lame_LameMp3_createLameMp3Client( JNIEnv *env, jobject thiz) { lame_global_flags *client = lame_init(); LOGD("createLameMp3Client: %ld", (long) client); return reinterpret_cast<jlong>(client); } extern "C" JNIEXPORT int JNICALL Java_me_linjw_lib_lame_LameMp3_close( JNIEnv *env, jobject thiz, jlong clientPtr) { lame_global_flags *client = reinterpret_cast<lame_global_flags *>(clientPtr); LOGD("close(%ld)", client); return lame_close(client); }
详细代码参考LameMp3.kt 和native-lib.cpp
DEMO代码 DEMO代码已经放到github 上