流媒体技术学习笔记之(六)FFmpeg官方文档先进音频编码(AAC)

news/2024/7/10 22:17:52 标签: ffmpeg, 嵌入式

先进音频编码(AAC)的后继格式到MP3,和以MPEG-4部分3(ISO / IEC 14496-3)被定义。它通常用于MP4容器格式; 对于音乐,通常使用.m4a扩展名。第二最常见的用途是在MKV(Matroska)文件内,因为它比MP4更好地支持嵌入式基于文本的软字幕。本指南中的示例将使用扩展MP4和M4A。

FFmpeg的可支持两个AAC-LC编码器(AAClibfdk_aac)和一个HE-AAC(V1 / 2)编码器(libfdk_aac)。的许可证libfdk_aac不与GPL兼容,因此GPL不允许含有不兼容的代码的二进制文件的分发时也被包含GPL许可的代码。因此,此编码器已被指定为“非自由”,您不能下载支持它的预构建的ffmpeg。这可以通过解决编译FFmpeg的自己。

libfdk_aac 

Fraunhofer FDK AAC编解码器库。这是目前使用ffmpeg的最高质量的AAC编码器。ffmpeg的要求要与配置--enable-libfdk-AAC(另外--enable-nonfree的,如果您还使用--enable-GPL)。但要注意,它默认为约14kHz的(低通滤波器的细节)。如果您想保留更高的频率,使用-cutoff 18000。只有在需要时才将数字调整到频率上限; 记住,更高的限制可能可听见地降低总体质量。

恒定比特率(CBR)模式

这些设置针对特定的比特率,样本之间的变化较小。它可以更好地控制文件大小,并且与HE-AAC配置文件兼容。作为经验法则,对于可听的透明度,对于每个通道使用64kb / s(因此对于立体声为128kb / s,对于5.1环绕声为384kb / s)。设置与比特率-b:一个选项。

在M4A(MP4)容器中将音频文件转换为AAC:

ffmpeg -i input.wav -c:a libfdk_aac -b:a 128k output.m4a

转换视频的5.1环绕声音频,只留下视频:

ffmpeg -i input.mp4 -c:v copy -c:a libfdk_aac -b:a 384k output.mp4

转换的视频与libx264,对一个700MB(= 5734400kb)CD-ROM安装一个90分钟的电影,缩混音频两个通道(Windows用户应该使用的目标NUL而不是的/ dev / null的):

ffmpeg -y -i input.mp4 -c:v libx264 -b:v 933k -preset:v veryfast -pass 1 -an / dev / null && \
ffmpeg -i input.mp4 -c:v libx264 -b:v 933k -preset:v veryfast -pass 2 \
-ac 2 -c:a libfdk_aac -b:128k output.mp4

可变比特率(VBR)模式

靶向质量,而不是一个特定的比特率。1是最低质量,5是最高质量。设置与该VBR水平-vbr标志。

VBR模式大致给出了每通道(以下比特率的详细信息):

 
VBRkbps /信道AOT
120-32LC,HE,HEv2
232-40LC,HE,HEv2
348-56LC,HE,HEv2
464-72LC
596-112LC

 

 

 

 

 

 

HE比特率将低得多。

在M4A(MP4)容器中将音频文件转换为AAC:

ffmpeg -i input.wav -c:a libfdk_aac -vbr 3 output.m4a

仅转换视频的音频:

ffmpeg -i input.mp4 -c:v copy -c:a libfdk_aac -vbr 3 output.mp4

转换与视频libx264和音频缩混到两个渠道:

ffmpeg -i input.mp4 -c:v libx264 -crf 22 -preset:v veryfast \
-ac 2 -c:a libfdk_aac -vbr 3 output.mp4

高效率AAC 

这是针对低比特率(版本1和版本2)定制的一对AAC配置文件。HE-AAC版本1适合低于64kb / s(立体声音频)下降到约48kb / s的比特率,而HE-AAC版本2适用于低至32kb / s的比特率(同样,对于立体声)。

注意: HE-AAC版本2只处理立体声。如果您有单声道,或想要下混音为单声道,请使用HE-AAC版本1。

不幸的是,可以播放AAC-LC(默认配置文件的许多设备libfdk_aac)根本无法起到HE-AAC的任一版本,所以这是不推荐的环绕声音频,通常需要与这样的硬件播放器兼容。如果你只是打算在电脑上播放,或者你确定你的硬件播放器支持HE-AAC,你可以针对版本1的比特率为160kb / s,对于版本2的比特率为128kb / s。 ,实验看看什么对你的耳朵有用。

HE-AAC版本1 

ffmpeg -i input.wav -c:a libfdk_aac -profile:aac_he -b:64k output.m4a

HE-AAC版本2 

ffmpeg -i input.wav -c:a libfdk_aac -profile:aac_he_v2 -b:a 32k output.m4a

本地FFmpeg的AAC编码

原生FFmpeg AAC编码器。这是目前第二高质量的AAC编码器可用于FFmpeg,不需要像这里描述的其他AAC编码器的外部库。这是默认的AAC编码器。

注意: -strict实验(或-strict -2)以前需要这种编码器中,但它是不再试验和这些选项是不必要的,因为2015年12月5日。

例如使用-b:a

ffmpeg -i input.wav -c:a aac -b:a 160k output.m4a

例如使用-q:a

ffmpeg -i input.wav -c:a aac -q:a 2 output.m4a

有效范围为-q:一个是0.1-2左右。这个VBR是实验性的,并且可能获得比CBR更差的结果。


不推荐使用/取出编码器

libfaac 

免费软件高级音频编码器,该库的支持已被删除。

libvo_aacenc 

视龙AAC编码库。该库的支持已被删除。使用原生FFmpeg编码器:它提供更好的质量和支持超过2个通道。

libaacplus 

AAC +编码库,支持该库已被删除。使用 libfdk_aac不是为HE-AAC:它在所有码率一贯更好。


元数据

您可以向本指南的任何示例添加元数据:

ffmpeg -i input ... -metadata author =“FFmpeg Bayou Jug Band”-metadata title =“Decode my Heart(Let's Mux)”output.mp4

渐进式下载

默认情况下,MP4 muxer在音频流('mdat'atom)之后的文件末尾写入'moov'原子。这导致用户需要在可以进行播放之前完全下载文件。将此moov原子重定位到文件的开头可以方便在客户端完全下载文件之前回放。

你可以用做-movflags +的fastStart选项:

ffmpeg -i input.wav -c:a libfdk_aac -movflags + faststart output.m4a

您也可以在现有MP4 / M4A文件上使用此选项。由于音频的仅仅是数据流复制有重新编码没有发生,只是重新混流,等于是没有质量损失:

ffmpeg -i input.m4a -c:a copy -movflags + faststart output.m4a

常见问题

哪个编码器提供最好的质量?

对于AAC-LC:libfdk_aac > Native FFmpeg AAC encoder (aac).

对于HE-AAC你有一个选择:libfdk_aac

我应该使用AAC-LC还是HE-AAC?

如果您需要低音频比特率,例如≤32kbs /通道,那么HE-AAC将值得考虑,如果您的播放器或设备可以支持HE-AAC解码。由于较少的处理,任何较高的可能从AAC-LC获益更多。如果有疑问,使用AAC-LC。所有支持HE-AAC的玩家也支持AAC-LC。

转载于:https://www.cnblogs.com/xiaoleiel/p/11160631.html


http://www.niftyadmin.cn/n/795176.html

相关文章

63.数据流中的中位数——剑指offer

题目描述 如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流&…

MySQL 大小写敏感修改不了

1. 症状 今天安装 KBengine 引擎的时候,修改 MySQL 配置文件 my.ini 中的 lower_case_table_names2 想让 MySQL 对大小写不敏感,但无论如何都不生效 2. 解决办法 卸载 wampserver,我的 MySQL 是里面的 ,这样安装的优点是简单…

03 Python数值类型及数字类型详解

Python的9大数值类型: Python中有4种数字类型和5种序列类型,共9种数值类型。 4种数字类型分别是:整型(int),浮点型(float),复数(complex),布尔值(bool)。 5种序列类型分别是:列表(list)&#xf…

Machine:findBroadcastInterface....not a valid interface

帮朋友装 KBEngine 的时候遇到的问题,她一直解决不掉,我就感觉应该是一些配置问题。今天拿到截图分析了很久才解决,办法异常简单,但我觉得比这更重要的是解决问题的思路,在这记录下来,以希望能解决一类问题…

js取得、設置高度問題(offsetHeight為0) ,window.onload()執行時間

等到文档全部加载完,才执行window.onload內的函数 Code1 <table id"tbEdit"> 2 …… 3 </table> 4 <div id"divFill" style"height:260px"></div> 5 <script type"text/javascript"> 6 window.onload …

提权常用DOS命令运用

写在前面&#xff0c;我只是个菜鸡&#xff0c;以前学过点&#xff0c;趁着现在没什么事情拿过来玩一下&#xff0c;想一起交流下的朋友加&#xff1a;1092417123&#xff0c;大家一起进步 1.运行环境 cmd 窗口中运行这些命令 2. DOS 命令 查看版本&#xff1a;ver 查看权限…

SQLyog 导入数据库

最上方工具栏 –> 执行SQL脚本 –> 选择要导入的SQL文件

使用python来反查数据表中的字段名

1. 链接数据库 import psycopg2 conn psycopg2.connect(user,host,port,database,password) cur conn.cursor() 2. 如果不知道数据表中的字段名&#xff0c;则可以通过以下方式来获取表中的字段名 首先需要获取指针 cur.execute(select * from your_table) print(cur.descrip…