盒子
盒子
文章目录
  1. 录音PCM
  2. 使用LAME进行MP3编码
    1. 编译
    2. 导入AndroidStudio
  3. lame基本使用
    1. 初始化
      1. 编码质量
    2. MP3编码
    3. 清理工作
  4. 结合JNI进行使用
  5. DEMO代码

安卓录制MP3(二) - LAME使用

上篇文章介绍了数字音频的基础知识,这篇文章我们来看看代码应该怎么写:

录音PCM

第一步我们先用AudioRecord录制PCM音频:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
private lateinit var buffer: ByteArray

fun start(audioSource: Int, sampleRate: Int, channelConfig: Int, audioFormat: Int): Boolean {
...
val bufferSize = AudioRecord.getMinBufferSize(sampleRate, channelConfig, audioFormat)

buffer = ByteArray(bufferSize)
recorder = AudioRecord(audioSource, sampleRate, channelConfig, audioFormat, bufferSize)

recorderThread = RecordThread()
recorderThread?.start()
return true
}

inner class RecordThread : Thread() {
override fun run() {
super.run()

var readLen: Int
recorder?.startRecording()
while (recorder?.recordingState == AudioRecord.RECORDSTATE_RECORDING) {
readLen = recorder?.read(buffer, 0, buffer.size) ?: break
listener.onRecord(buffer, readLen)
}
recorder = null
}
}

可以看到AudioRecord的使用很简单,就是创建一个AudioRecord对象然后在子线程中不断地read就好,audioSource指的是通过哪个设备录音,其他的几个参数在基础部分都有讲过,就不过多介绍了:

1
2
3
4
5
6
private const val AUDIO_SOURCE = MediaRecorder.AudioSource.MIC
private const val SAMPLE_RATE = 44100
private const val AUDIO_FORMAT = AudioFormat.ENCODING_PCM_16BIT
private const val CHANNEL_CONFIG = AudioFormat.CHANNEL_IN_MONO // 单通道
//private const val CHANNEL_CONFIG = AudioFormat.CHANNEL_IN_STEREO // 双通道
recorder.start(AUDIO_SOURCE, SAMPLE_RATE, CHANNEL_CONFIG, AUDIO_FORMAT)

当然,记得需要申请录音权限:

1
<uses-permission android:name="android.permission.RECORD_AUDIO" />

使用LAME进行MP3编码

得到PCM裸流之后我们就需要对他进行MP3编码,LAME就是一个开源的MP3音频压缩软件,也是公认有损MP3中压缩效果最好的编码器。

编译

使用LAME需要自行编译出静态库,首先我们从LAME的官网下载最新版本的LAME源码。从源码文件目录结构中可以看出它使用AutoMake编译,之前写过几篇AutoMake的学习笔记,感兴趣的同学可以看看。

或者也可以直接修改Demo工程的build-lame.sh。修改开头的NDK路径、安卓版本、abi这几个参数接口直接运行在output目录生成出.a文件和.h文件:

1
2
3
4
5
6
7
#!/bin/zsh

NDK_ROOT=/Users/linjw/Library/Android/sdk/ndk/22.1.7171670
ANDROID_API_VERSION=21
NDK_TOOLCHAIN_ABI_VERSION=4.9
ABIS=(armeabi armeabi-v7a arm64-v8a x86 x86_64)
...

导入AndroidStudio

得到静态库之后在CMake中导入静态库:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
cmake_minimum_required(VERSION 3.18.1)


project("lame")

add_library(
lame
SHARED
native-lib.cpp)

# 导入lame头文件
include_directories(${CMAKE_SOURCE_DIR}/include)

#导入lame静态库
add_library(mp3lame STATIC IMPORTED)
set_target_properties(
mp3lame
PROPERTIES IMPORTED_LOCATION
${CMAKE_SOURCE_DIR}/../../../jniLibs/${ANDROID_ABI}/libmp3lame.a)

find_library(
log-lib
log)

target_link_libraries(
lame
mp3lame # 链接lame静态库
${log-lib})

lame基本使用

初始化

在了解了MP3的基础知识之后其实很容易上手lame。

第一步无非就是一些音频参数的初始化设置:

1
2
3
4
5
6
7
8
9
10
第一步: 创建lame_global_flags*
lame_global_flags *client = lame_init();

第二步: 配置参数
lame_set_in_samplerate(client, 44100); // 输入采样率
lame_set_out_samplerate(client, 44100); // 输出采样率44100
lame_set_num_channels(client, 2); // 通道数2
lame_set_brate(client, 128); // 比特率128kbps
lame_set_quality(client, 2); // 编码质量2
lame_init_params(client); // 初始化参数

编码质量

上面的参数大部分都在前一篇介绍过了,只剩一个编码质量没讲过,他其实是用来选择压缩算法的。算法编号从0到9,0音质最好但是算法最复杂也最耗时,9音质最差但算法效率最高。一般会选择2。

比特率和压缩算法都能决定MP3的音质。压缩前的PCM裸流音质最好,大小最大。

由于MP3的大小等于比特率乘时长,压缩后的MP3比特率越大,那么它的大小就越大,就越接近压缩前的PCM,损失的信息也就越少,解压之后就越接近原本的PCM的曲线,音质自然就越好。

而选择压缩算法的意义在于,在相同比特率的情况下( MP3文件大小相同),好的压缩算法解压出来的声音曲线能更接近原本的PCM曲线,但是相应的它的计算量就会更大。

可以说选择大的比特率是用存储空间换音质,而选择音质高的压缩算法则是用cpu资源换音质。

MP3编码

配置好初始化参数之后就只要将PCM数据传递给LAME进行压缩即可,这里有几种PCM的传递方式:

1. 左右通道分开输入

双通道立体声,有时候左右通道的数据会放在不同的文件里面,可以使用下面的方法去编码MP3:

1
2
3
4
5
6
7
int CDECL lame_encode_buffer (
lame_global_flags* gfp, /* global context handle */
const short int buffer_l [], /* PCM data for left channel */
const short int buffer_r [], /* PCM data for right channel */
const int nsamples, /* number of samples per channel */
unsigned char* mp3buf, /* pointer to encoded MP3 stream */
const int mp3buf_size ); /* number of valid octets in this stream */
  • gfp : lame_init返回的lame_global_flags*
  • buffer_l : 左通道数据
  • buffer_r : 右通道数据
  • nsamples : 每个通道的采样点数量。例如当AudioFormat为16bit的时候, 一个采样点大小为2byte, 则nsamples = buffer_l有效数据长度(byte) / 2
  • mp3buf : 编码后的MP3会存放到这里
  • mp3buf_size : mp3buf的大小,它可以通过采样率、比特率和前面的nsamples计算出来,不过LAME提供了一个最大buffer大小计算的简单算法(1.25*nsamples + 7200 byte)

他的返回值如下:

  • >=0 : 编码后的MP3数据的大小,即存储到mp3buf的MP3音频的byte数
  • -1 : mp3buf的大小太小
  • -2 : malloc()方法出现问题
  • -3 : lame_init_params()没有调用
  • -4 : 音频数据异常

参考代码:

1
int encodeSize = lame_encode_buffer_interleaved(client, pcm, numSamples, result, resultSize);

2. 单通道输入

有时候我们的数据只会有一个通道的数据,例如AudioRecord的ChannelConfig配置成AudioFormat.CHANNEL_IN_MONO。

这个时候我们只需要把right输入设置成NULL即可:

1
int encodeSize = lame_encode_buffer(client, left, null, numSamples, result, resultSize);

3. 多通道混合输入

当AudioRecord的ChannelConfig配置成AudioFormat.CHANNEL_IN_STEREO。左右声道的数据会交叉存储在PCM裸流中。或者其他更多通道混合输入的时候我们可以用lame_encode_buffer_interleaved方法进行编码:

1
2
3
4
5
6
int CDECL lame_encode_buffer_interleaved(
lame_global_flags* gfp, /* global context handlei */
short int pcm[], /* PCM data for left and right channel, interleaved */
int num_samples, /* number of samples per channel, _not_ number of samples in pcm [] */
unsigned char* mp3buf, /* pointer to encoded MP3 stream */
int mp3buf_size ); /* number of valid octets in this stream */

指的注意的是,这里的num_samples指的是每个通道的采样点数,而不是所有通道的采样点数之和。

例如当AudioFormat为16bit、双通道输入的时候, 一个采样点大小为2byte, 则

nsamples = buffer_l有效数据长度(byte) / 2(16bite为2byte) / 2(通道数为2)

1
int encodeSize = lame_encode_buffer_interleaved(client, pcm, numSamples, result, resultSize);

清理工作

当编码结束之后我们可以用lame_close方法进行清理:

1
lame_close(client);

结合JNI进行使用

由于LAEM的使用需要保存lame_global_flags,我们可以将它强转成long传到java进行保存,在需要的时候再讲传入的long强转回lame_global_flags:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
class LameMp3 {
private var lameClientPtr: Long = createLameMp3Client()

fun destroy(): Int {
val ret = close(lameClientPtr)
lameClientPtr = 0
return ret
}

...
private external fun createLameMp3Client(): Long
private external fun close(client: Long): Int
...
}

extern "C" JNIEXPORT jlong JNICALL
Java_me_linjw_lib_lame_LameMp3_createLameMp3Client(
JNIEnv *env,
jobject thiz) {
lame_global_flags *client = lame_init();
LOGD("createLameMp3Client: %ld", (long) client);
return reinterpret_cast<jlong>(client);
}


extern "C" JNIEXPORT int JNICALL
Java_me_linjw_lib_lame_LameMp3_close(
JNIEnv *env,
jobject thiz,
jlong clientPtr) {
lame_global_flags *client = reinterpret_cast<lame_global_flags *>(clientPtr);
LOGD("close(%ld)", client);
return lame_close(client);
}

详细代码参考LameMp3.ktnative-lib.cpp

DEMO代码

DEMO代码已经放到github