Java合并WAV必须校验并统一所有文件的PCM参数(采样率、位深、声道等),仅拼接data块并重写RIFF头部长度字段;若格式不一致需重采样或拒绝合并,推荐用ffmpeg替代手动字节操作。
WAV 是 RIFF 容器格式,头部包含 fmt 子块(音频格式)和 data 子块(原始采样数据)。Java 标准库 javax.sound.sampled 能读取/写入单个 WAV,但不支持直接拼接多个文件——因为合并不是简单字节追加,必须校验并统一所有文件的音频参数(采样率、位深度、声道数),且要重写最终的 RIFF 头部长度字段。跳过校验直接拼接会导致播放失败或杂音。
必须确保所有输入文件是同格式 PCM,否则无法无损拼接。以下检查逻辑不可省略:
AudioFormat.getEncoding() 必须为 AudioFormat.Encoding.PCM_SIGNED
AudioFormat.getSampleRate()、getSampleSizeInBits()、getChannels()、getFrameRate()、getFrameSize() 全部一致示例校验代码:
for (File file : wavFiles) {
AudioInputStream ais = AudioSystem.getAudioInputStream(file);
AudioFormat format = ais.getFormat();
if (!format.getEncoding().equals(AudioFormat.Encoding.PCM_SIGNED)) {
throw new IllegalArgumentException("Only PCM_SIGNED WAV supported: " + file);
}
if (!format.equals(firstFormat)) { // firstFormat 来自第一个文件
throw new IllegalArgumentException("Format mismatch at " + file + ": " + format);
}
}
WAV 文件结构是:"RIFF" + 4-byte length + "WAVE" + fmt-chunk + data-chunk。拼接时只取第一个文件的 RIFF 头 + fmt 块,再把所有文件的 data 块内容顺序追加,最后更新总长度字段(从第 4 字节开始的 4 字节小端整数)。
AudioSystem.write() 直接写多段流——它会为每段生成独立头部FileInputStream 读原始字节,跳过前 44 字节(标准头大小),提取 fmt 块(通常 24 字节,但需按 chunk size 解析)关键字节操作示例(简化版):
byte[] riffHeader = readFirstWavHeader(firstWav); // 读前 12 字节确认 "RIFFxxxxWAVE" byte[] fmtChunk = extractFmtChunk(firstWav); // 从第一个文件中完整提取 fmt 子块 long totalDataBytes = 0; for (File f : wavFiles) totalDataBytes += getDataLength(f); // 跳过头,读 data chunk size int totalLength = 4 + 4 + 4 + fmtChunk.length + (int)totalDataBytes; riffHeader[4] = (byte)(totalLength & 0xFF); riffHeader[5] = (byte)((totalLength >> 8) & 0xFF); riffHeader[6] = (byte)((totalLength >> 16) & 0xFF); riffHeader[7] = (byte)((totalLength >> 24) & 0xFF); // 小端写入 length 字段
如果项目允许引入外部依赖或命令行工具,比手写 RIFF 解析更可靠:
JAVE (Java Audio Video Encoder) 底层调用 ffmpeg,支持 WAV 拼接,但需注意其 MultiInputAudioAttributes 对 WAV 支持有限,建议转为临时 MP3 再合并回 WAVffmpeg:ffmpeg -i "concat:file1.wav|file2.wav|file3.wav" -c copy output.wav —— 这要求所有输入严格同格式,且 ffmpeg 版本 ≥ 4.1Runtime.getRuntime().exec() 调用时,务必检查 ffmpeg 是否在 PATH,并捕获 stderr 判断是否因格式不匹配失败纯 Java 方案看似“干净”,但 RIFF 头解析稍有偏差(比如忽略可能存在的 LIST 或 fact 块)就会导致文件损坏;生产环境建议优先走 ffmpeg 路径。