AI与HOLOSOUND

AI与HOLOSOUND.png

人工智能（Artificial Intelligence），英文缩写为AI。随着以卷积神经网络（CNN）及生成式对抗网络（GAN）为代表的人工智能算法技术在影像领域的应用和进一步的成熟，计算机视觉技术在近年来大放异彩，AI在图像增强、内容理解等方面给视频技术增色不少，成为了流媒体平台的标配。

AI进入音频领域的步伐要晚一点，但是技术进展却令人印象深刻，基于人工智能的语音识别、语音合成、声源定位以及自动渲染等等多种技术上都取得了突破。

LEONIS作为一家创新型科技企业，将沉浸式音频技术HOLOSOUND与AI技术结合，实现了包括AI-Design、AI-Position以及AI-Render等极为震撼的技术。

1> HS-AI-DESIGN

通过将沉浸式音频技术HOLOSOUND与人工智能技术AI结合，开发了HOLOSOUND AI-Conf Tools，可以通过输入影厅的详细数据，设定各项细化的参数，结合扬声器和功放品牌可自动形成详细的配置，实现了HOLOSOUND影厅扬声器的自动布局。

图1.HOLOSOUND AI-Conf Tools完成的扬声器布局图1

图2.HOLOSOUND AI-Conf Tools完成的扬声器布局图2

HOLOSOUND AI-Conf Tools有几大优点：

1.AI智能算法，更能贴合实际需求

2.工程化管理

3.用户可以自定义扬声器与功放数据库

2> HS-AI-POSITION

基于人耳听觉机理，通过使用独有的算法和模型，HS-AI-Position可以实现点声源的自动定位，准确度在+/-1度之内（方位角与俯仰角）。

使用LEONIS麦克风阵列和人工头分析仪，并结合HS-AI-Position，采用特殊的算法，LEONIS提出了沉浸式音频指数的概念，该指数克服了传统的音频评价方式主观性极强的弊端，以量化指标来评价音频好坏，使得评价结果变得更加准确。AII音频沉浸式指数填补了音频评价方法的空白，可以用来对比沉浸式音频和非沉浸式音频，也可以用来在各类沉浸式音频间做对比，它让音频评价更加的便捷简单。

图3.HOLOSOUND AI Position点声源定位系统

图4. 音频沉浸式指数AII 对比图

3> HS-AI-RENDER

通过运用人工智能AI技术，HS-AI-Render可以实现音频的自动渲染，将声音还放到通过HS-AI-Design自动布局的声场中，让声音环绕观众周围，还原真实的音景，可以实现最大256个声道的输出。具体产品包括：沉浸式音频处理器DCAP-IA、沉浸式音频处理器DCAP-OBIA、增强版沉浸式音频处理器DCAP-OBIA-E等。

微信图片_20191207165753-XIAO.png

图5.HS-AI-Render渲染

图6.沉浸式音频处理器DCAP-IA

图7.沉浸式音频处理器DCAP-OBIA & DCAP-OBIA-E