您的当前位置是:首页 > 5G与AI > AI与HOLOSOUND
人工智能(Artificial Intelligence),英文缩写为AI。随着以卷积神经网络(CNN)及生成式对抗网络(GAN)为代表的人工智能算法技术在影像领域的应用和进一步的成熟,计算机视觉技术在近年来大放异彩,AI在图像增强、内容理解等方面给视频技术增色不少,成为了流媒体平台的标配。
AI进入音频领域的步伐要晚一点,但是技术进展却令人印象深刻,基于人工智能的语音识别、语音合成、声源定位以及自动渲染等等多种技术上都取得了突破。
LEONIS作为一家创新型科技企业,将沉浸式音频技术HOLOSOUND与AI技术结合,实现了包括AI-Design、AI-Position以及AI-Render等极为震撼的技术。
1> HS-AI-DESIGN
通过将沉浸式音频技术HOLOSOUND与人工智能技术AI结合,开发了HOLOSOUND AI-Conf Tools,可以通过输入影厅的详细数据,设定各项细化的参数,结合扬声器和功放品牌可自动形成详细的配置,实现了HOLOSOUND影厅扬声器的自动布局。
图1.HOLOSOUND AI-Conf Tools完成的扬声器布局图1
图2.HOLOSOUND AI-Conf Tools完成的扬声器布局图2
HOLOSOUND AI-Conf Tools有几大优点:
1.AI智能算法,更能贴合实际需求
2.工程化管理
3.用户可以自定义扬声器与功放数据库
2> HS-AI-POSITION
基于人耳听觉机理,通过使用独有的算法和模型,HS-AI-Position可以实现点声源的自动定位,准确度在+/-1度之内(方位角与俯仰角)。
使用LEONIS麦克风阵列和人工头分析仪,并结合HS-AI-Position,采用特殊的算法,LEONIS提出了沉浸式音频指数的概念,该指数克服了传统的音频评价方式主观性极强的弊端,以量化指标来评价音频好坏,使得评价结果变得更加准确。AII音频沉浸式指数填补了音频评价方法的空白,可以用来对比沉浸式音频和非沉浸式音频,也可以用来在各类沉浸式音频间做对比,它让音频评价更加的便捷简单。
图3.HOLOSOUND AI Position点声源定位系统
图4. 音频沉浸式指数AII 对比图
3> HS-AI-RENDER
通过运用人工智能AI技术,HS-AI-Render可以实现音频的自动渲染,将声音还放到通过HS-AI-Design自动布局的声场中,让声音环绕观众周围,还原真实的音景,可以实现最大256个声道的输出。具体产品包括:沉浸式音频处理器DCAP-IA、沉浸式音频处理器DCAP-OBIA、增强版沉浸式音频处理器DCAP-OBIA-E等。
图5.HS-AI-Render渲染
图6.沉浸式音频处理器DCAP-IA
图7.沉浸式音频处理器DCAP-OBIA & DCAP-OBIA-E