audio toolbox 产品信息 -凯发k8网页登录

设计和分析语音、声学和音频处理系统

audio toolbox™ 为音频处理、语音分析和声学测量提供工具。它包含各种算法，可用于处理音频信号（例如均衡和时间拉伸）、估计声信号指标（例如响度和清晰度）以及提取音频特征（例如 mfcc 和基音）。它还提供先进的机器学习模型（包括 i-vector）和预训练深度学习网络（包括 vggish 和 crepe）。工具箱 app 支持实时算法测试、脉冲响应测量和信号标注。该工具箱提供了面向 asio、coreaudio 和其他声卡以及 midi 设备的流接口，以及用于生成和托管 vst 和 audio units 插件的工具。

audio toolbox 支持您导入、标注和增强音频数据集，以及提取特征以便训练机器学习和深度学习模型。所提供的预训练模型可应用于录音，以进行高级语义分析。

通过对声卡流式传输低延迟音频，您可以实时构建音频处理算法原型，或运行自定义声学测量。您可以将算法转变为音频插件，以在外部托管应用程序（如 digital audio workstations）中运行，从而对其进行验证。通过插件托管，您可以将外部音频插件作为常规 matlab^® 对象使用。

开始：

通过音频接口进行流式采集和播放

连接到标准笔记本电脑和台式机声卡，以便在任意文件与实时输入和输出之间流式传输低延迟多声道音频。

与标准音频驱动程序之间的连接

在 windows^®、mac^® 和 linux^® 操作系统间，使用标准音频驱动程序（如 asio、wasapi、coreaudio 和 alsa）对声卡（如 usb 或 thunderbolt™）读取和写入音频样本。

audio toolbox 提供的音频支持

matlab 中的实时音频

多声道声卡示例。

低延迟多声道音频流式传输

在 matlab 中处理实时音频，双向延迟仅为毫秒级。

音频 i/o：缓冲、延迟和吞吐量

测量音频延迟

来自四声道麦克风阵列的实时原始输入。

机器学习和深度学习

标注、增强、创建和摄取音频和语音数据集，提取特征，并计算时频变换。使用 statistics and machine learning toolbox™、deep learning toolbox™ 或其他机器学习工具开发音频和语音分析。

预训练的深度学习模型

使用深度学习，只需一行代码，即可执行复杂的信号处理任务、提取音频嵌入。访问成熟的预训练网络，如 yamnet、vggish、crepe、openl3，并借助预配置的特征提取函数应用它们。

预训练网络

对音频信号中的声音进行分类

yamnet 神经网络

vggish 神经网络

词云，显示特定音频片段中由 classifysound 标识的声音类型。

针对音频、语音和声学的特征提取

将信号变换为时频表示，例如 mel、bark 和 erb 频谱图。计算倒谱系数（例如 mfcc 和 gtcc）和标量特征（例如基音、调和性和频谱描述符）。使用经预训练的深度学习模型（vggish、openl3）和 i-vector 系统提取高级特征和信号嵌入。使用兼容的 gpu 卡加速特征提取。

音频特征提取器

了解 vggishfeatures

使用深度学习检测噪声中的语音活动

语音命令的实时 mel 频谱图。

机器学习模型和训练方法

用音频数据集训练前沿机器学习模型。将成熟的模型系统（如 i-vector）用于说话人识别和验证等应用。从实例中学习如何为音频、语音和声学应用设计和训练高级神经网络和层。

了解 ivectorsystem

使用 x-vector 进行说话人分割聚类

用 x-vector 对包括 5 个不同说话人的语音信号进行处理后获得的分割聚类结果。

导入、注释和预处理音频数据集

读取、分割和预处理大型录音集合。使用 app 手动对音频信号进行注释。使用预训练的机器学习模型自动识别和分割感兴趣区域。

了解 audiodatastore

使用音频标注器标注音频

将音频文件数据导入信号标注器

语音到文本转录

音频标注器 app 中的感兴趣区域标签。

增强及合成音频和语音数据集

综合使用音调换挡、时间拉伸和其他音频处理效果，建立随机化数据增强管道。使用基于云的文本转语音服务，从文本创建合成语音记录。

文本转语音合成

音频数据增强器

音调不变的时间拉伸

音调换挡

音色不变音调换挡的共振峰估计。

音频处理算法和效果

生成标准波形，应用常见音频效果，设计具有动态参数调优和实时可视化的音频处理系统。

音频滤波器和均衡器

建模和应用参数 eq、图形 eq、斜坡和可变斜率滤波器。设计和仿真数字交叉、倍频程和分数倍频程滤波器。

参数均衡

图形均衡

参数均衡器设计

具有实时可视化的三频带交叉滤波器的交互式调优。

动态范围控制和效果

建模和应用动态范围处理算法，如压缩器、限制器、扩展器和噪声门。使用递归参数模型添加人工混响。

动态范围控制

多频带动态范围压缩

压缩器动态响应的交互式调优。

使用模块图进行系统仿真

使用 simulink^® 的音频处理模块库设计和仿真系统模型。使用交互式控件和动态绘图来调优参数和可视化系统行为。

simulink 中的实时音频

多频带动态范围压缩

simulink 中的多频带动态范围压缩器模型的详细信息。

实时音频原型构建

在 matlab 中使用交互式实时侦听测试验证音频处理算法。

通过用户界面进行实时参数调优

自动为音频处理算法的可调优参数创建用户界面。使用音频测试台测试各个算法，使用自动生成的交互式控件在程序运行过程中调优参数。

音频测试台演示教程

实时参数调优

基于延迟的音频效果

使用音频测试台进行自定义三频带参数 eq 的交互式调优。

用于参数控制和消息交换的 midi 连接

使用 midi 控制台以交互方式更改 matlab 算法的参数。通过发送和接收各种类型的 midi 消息来控制外部硬件或对事件作出响应。

daw、音频插件和 midi 控制器是什么？

midi 设备接口

音频插件的 midi 控制

在 matlab 中为乐器合成器编写 midi 消息和音频信号流。

声学测量和空间音频

测量系统响应、分析和计量信号以及设计空间音频处理系统。

基于标准的计量和分析

将声压级 (spl) 表和响度表应用于记录的信号或实时信号。使用倍频程和分数倍频程滤波器分析信号。将符合标准的 a、c 或 k 加权滤波器应用于原始记录。测量声音的清晰度、粗糙度和起伏强度。

倍频程频带的声压测量

基于音调跟踪的 thd n 测量

基于头部跟踪的双声道音频渲染

隔音对噪声感知水平的影响

2/3 倍频程频带上不同 spl 测量的可视化。

脉冲响应测量

使用最大长度序列 (mls) 和指数扫描正弦曲线 (ess) 测量声学和音频系统的脉冲和频率响应。借助脉冲响应测量仪轻松上手。以编程方式生成激励信号并估计系统响应，从而实现自动测量。

脉冲响应测量仪演示教程

测量音频设备的频率响应

脉冲响应测量仪。

房间脉冲响应的高效卷积

通过频域重叠相加或重叠保留，实现长脉冲响应信号的高效卷积。使用自动脉冲响应分区通过减少延迟提高计算速度。

测量音频系统的脉冲响应

了解分区频域 fir 滤波器

持续 5 秒或以上的脉冲响应，采样率 44100 hz，采样数 220k。

空间音频

对不同环绕声格式进行编码和解码。对空间采样的头部相关传输函数 (hrtf) 进行插值。

环绕声双声道解码

环绕声插件生成

示例显示了理想音源位置和可获得 hrtf 测量的最近角度。

生成和托管音频插件

为在 matlab 中以标准音频插件形式编写的音频处理算法构建原型；将外部音频插件作为常规 matlab 对象使用。

生成音频插件

直接从 matlab 代码生成 vst 插件、au 插件和独立可执行插件，而不需要手动设计用户界面。如需进行更高级的插件原型构建，还可以生成立可编译型 juce c 工程项目（需要 matlab coder™）。

音频插件示例库

设计音频插件

多频带参数 eq 示例：从 matlab 代码生成并在 reaper 中运行的 vst 插件。

托管外部音频插件

将外部 vst 和 au 插件作为常规 matlab 对象使用。您可以更改插件参数并以编程方式处理 matlab 数组。您也可以将插件参数与用户界面和 midi 控制的关联自动化。托管从 matlab 代码生成的插件以提高执行效率。

托管外部音频插件

示例显示了用于音频去噪的外部 vst 插件 (accusonus era-n) 及其 matlab 编程接口。

部署到嵌入式和实时音频系统

使用代码生成在软件设备上实现音频处理设计，并自动接入音频接口。

为 cpu 和 gpu 目标生成代码

使用 mathworks^® 编码器产品，从工具箱函数、对象和模块形式的信号处理和机器学习算法生成 c 和 c 源代码。通过专门的特征提取函数（如 mfcc 和 melspectrogram）生成 cuda 源代码。

代码生成和 gpu 支持

在 raspberry pi 上生成语音命令识别代码

该动态性能分析显示，基于深度学习的语音命令识别系统在 arm cortex-a 处理器上的实现得到了优化

低成本和移动设备

使用板载或外部多声道音频接口，在 raspberry pi™ 上为音频处理设计构建原型。以移动 app 的形式为 android^® 或 ios 设备创建交互式控制面板。

ios 设备的音频效果

raspberry pi 上的参数音频均衡器

用于设计原型的 raspberry pi 3 板。

零延迟系统

为基于单采样输入和输出的音频处理设计构建原型，以用于自适应噪声控制、助听验证或其他需要最小双向 dsp 延迟的应用程序。直接从 simulink 模型部署到 speedgoat 音频目标机和 st discovery 开发板。

embedded coder 提供的 st discovery 开发板支持

产品资源:

文档示例视频系统要求发行说明函数技术文章用户案例硬件支持 system objects

audio toolbox 产品信息 -凯发k8网页登录

设计和分析语音、声学和音频处理系统

开始：

通过音频接口进行流式采集和播放

与标准音频驱动程序之间的连接

低延迟多声道音频流式传输

机器学习和深度学习

预训练的深度学习模型

针对音频、语音和声学的特征提取

机器学习模型和训练方法

导入、注释和预处理音频数据集

增强及合成音频和语音数据集

音频处理算法和效果

音频滤波器和均衡器

动态范围控制和效果

使用模块图进行系统仿真

实时音频原型构建

通过用户界面进行实时参数调优

用于参数控制和消息交换的 midi 连接

声学测量和空间音频

基于标准的计量和分析

脉冲响应测量

房间脉冲响应的高效卷积

空间音频

生成和托管音频插件

生成音频插件

托管外部音频插件

部署到嵌入式和实时音频系统

为 cpu 和 gpu 目标生成代码

低成本和移动设备

零延迟系统

产品资源:

获取免费试用版

准备购买？

您是学生吗？

audio toolbox 产品信息 -凯发k8网页登录

设计和分析语音、声学和音频处理系统

开始：

通过音频接口进行流式采集和播放

与标准音频驱动程序之间的连接

标准音频接口

低延迟多声道音频流式传输

流式传输多声道音频输入

机器学习和深度学习

预训练的深度学习模型

一行代码实现声音分类

针对音频、语音和声学的特征提取

听觉频谱图

机器学习模型和训练方法

导入、注释和预处理音频数据集

增强及合成音频和语音数据集

语音共振峰估计

音频处理算法和效果

音频滤波器和均衡器

交叉滤波器

动态范围控制和效果

调节音频压缩器

使用模块图进行系统仿真

实时音频原型构建

通过用户界面进行实时参数调优

测试多频带参数 eq

用于参数控制和消息交换的 midi 连接

声学测量和空间音频

基于标准的计量和分析

1/3 倍频程 spl 分析

脉冲响应测量

房间脉冲响应的高效卷积

空间音频

生成和托管音频插件

生成音频插件

托管外部音频插件

部署到嵌入式和实时音频系统

为 cpu 和 gpu 目标生成代码

低成本和移动设备

零延迟系统

产品资源:

获取免费试用版

准备购买？

您是学生吗？

wechat