您的位置: 主页 > Google Lyra 数字语音编解码技术将导入人工智能 低速网络环境也能传递清晰通话内容

Google Lyra 数字语音编解码技术将导入人工智能 低速网络环境也能传递清晰通话内容

照片中提到了Mute、Keyрad、Speaker,包含了谷歌像素电话屏幕、像素2、像素点、Google Duo、打电话

目前Lyra技术的作法,会在每隔40毫秒时间采集一次语音特征,或是特定声音内容,其余部分则会在还原时藉由人工智能技术方式补正,意味数字语音资料在实际通话过程的所需传输比例将可大幅减少,在3Kbps位元率运作下约可降低60%以上网络频宽占用比例,处理延迟时间仅为90毫秒,因此可在使用者能接受范围内。

针对网络通话 (VoIP)服务使用需求,Google宣布打造高品质且具低位元特性的数字语音编解码技术Lyra,标榜在低速连接的网络环境仍可维持清晰、流畅语音通话效果。

依照Google说明,Lyra编解码技术采用机器学习模式,通过超过数千小时的语音内容学习训练后,即可将高度压缩后的数字语音封包完整还原,如此一来就能藉由低位元压缩比例让数字语音封包可在低速连接的网络环境快速传递,并且让还原后的数字语音内容维持清晰,避免产生机器人声情况。

虽然目前4G网络应用已经相当普及,同时不少国家地区也开始推行5G网络使用普及化,但仍有不少地区仅能以3G网络上网,甚至可能因为环境影响,造成网络传输相对缓慢情况,因此Google提出Lyra编解码技术,将能改善目前越来越多人习惯使用的数字语音通话服务使用体验,即便当下连网品质不佳,依然可以维持清晰通话。

目前Lyra技术的作法,会在每隔40毫秒时间采集一次语音特征,或是特定声音内容,其余部分则会在还原时藉由人工智能技术方式补正,意味数字语音资料在实际通话过程的所需传输比例将可大幅减少,在3Kbps位元率运作下约可降低60%以上网络频宽占用比例。同时,处理延迟时间仅为90毫秒,因此可在使用者能接受范围内。

而Google目前已经将Lyra技术应用在旗下数字语音通话服务Google Duo,并且与新版Android操作系统整合。

类似Lyra技术的作法,包含以WebRTC形式使用的数字语音通讯服务,多半采用开源设计的Opus编解码技术,主要通过32Kbps位元率进行压缩,但传输效率则会明显受到网络频宽影响,但若将位元率降低至6Kbps的话,则会产生明显机器人声现象。其他像是Speex、MELP或AMR在内编解码技术,虽然可以实现与Lyra技术相近的位元率表现,但由于不像Lyra技术采用人工智能技术加持,因此多半会有明显杂讯、机器人声。

上一篇:前 Oculus 工程师成立模块化笔记本电脑新创 Framework 除了 CPU 整机都能模块化自己更换
下一篇:Firefox 浏览器标志将永远使用火狐元素 曾采用迷因狗狗币图像的 Nightly 版是例外

您可能喜欢

回到顶部