虎牙持续创新AI安全应用 上线AI直播实时消音系统

虎牙持续创新AI安全应用 上线AI直播实时消音系统

来源:中国日报网     2022-08-04 14:02
来源: 中国日报网
2022-08-04 14:02 
分享
分享到
分享到微信

近日,虎牙直播的实时消音系统正式上线,并已在其平台应用。该系统为直播场景中先审后发的“事前防控”提供全面的监管能力。

据悉,目前主流的内容安全审核方法是AI+人工审查,这是一种“事后审查”的处理方式。而虎牙开发的这套系统是一种先审后发的技术,基于虎牙自研的音频算法以及多媒体加工平台leaf,可以在不增加直播延时的条件下,对直播过程中的违规音频进行实时消音,有效降低甚至完全阻断风险内容的传播,实现实时屏蔽、先审后发。“针对AI能力在内容风控上的场景应用,我们优先选择了人工审核难度高、效率慢的直播音频场景上进行应用,下一步,我们将在直播视频场景中做出尝试。”虎牙风控团队负责人表示。

为了在直播场景内做到无延时,虎牙多巴胺AI技术团队对语音识别模型以及解码模块进行了大量优化,对每个语音片段的解码能够达到稳定一致的识别时间。“这很重要,因为音频片段解码时间的大幅波动,会导致违规音频漏出。在普通的2.1G主频CPU上,我们的实时率达到0.08,相当于1s音频只需要80ms就能识别出来”,虎牙AI消音技术负责人表示。

直播场景的复杂性较一般的语音识别场景要大,而复杂场景的识别准确率一直是业界难点。“准确率低会造成直播的大面积误消音,使用户的体验感降低,召回率低会导致漏出违规语音,为了得到高召回、高准确率的目标,虎牙多巴胺团队开发了基于直播场景的VAD算法、语音识别算法、后处理算法,同时收集了大量复杂场景的样本,进行算法迭代优化,使得我们在直播这种复杂场景下,也有较高的识别准确率以及召回率。另一方面,AI模型的优化仍然依赖样本校准工作,这是大量的、系统性、长期且细致的。”上述负责人表示。

国家互联网信息办公室部署开展2022年"清朗"系列专项行动时指出,此次行动重点针对网络直播、信息内容乱象、网络谣言、未成年网络环境等10个方面。对每一家互联网内容平台来说,确保平台内容的合法性和规范性,健全平台内容审核机制成为必须重视的问题。

资料显示,虎牙于2015年开始研发的“天眼”AI引擎,将人工智能、计算机视觉等前沿技术成果与互联网内容安全相结合。该系统可针对不同场景赋能AI能力,实现智能识别(包含音视频、图像、文本)和业务风控的落地创新,让传统的内容安全工作更高效、更节省成本,并实现自动化风险预判。此外,“虎牙天眼内容安全SaaS解决方案”目前已于亚马逊云上线,实现了对网络视听行业的赋能。

虎牙直播内容风控负责人表示,平台一直深入推进内容安全保障工作, 采用“AI智能识别、人工审核和网络志愿者”三位一体模式。天眼实时消音系统是平台AI安全应用的一次扩容,平台将打造全方位安全攻防和更精准的内容审核体系,为健康的网络直播内容生态建设提供参考样本和前沿解决方案。

【责任编辑:张天磊】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn