中国科学网手机版

首页 > 科技 > 资讯 > 文章详情页

声网Agora推出智能语音识别方案助力视频内容高效审核

近日,全球实时音视频开创者声网Agora宣布推出一站式智能语音识别解决方案,将通过AI智能降噪、声纹检测、语音识别等技术,进行在线实时语音识别,帮助平台更智能、高效的识别语音中存在的涉黄、涉政、广告等违法违规信息。净化平台内容质量,降低监管风险,提升用户体验。

音频行业监管难 高效内容审核成平台刚需

一段时间以来,网络音频行业乱象频出。今年6月,国家网信办针对网络音频乱象问题启动专项整治行动,26款音频平台因传播历史虚无主义、淫秽色情等内容被采取约谈、下架、关停等处罚。

一方面,随着移动互联网的发展,UGC内容生产数量越来越庞大,ASMR、娇喘等色情擦边球内容频频出现在语音聊天室、直播、短视频等平台上;另一方面,相对于图文和视频,音频审核本身在技术上也更具难度,这大大增加了平台方的内容审核压力。因此,在国家网信办强监管的大背景下,借助更高效、便捷的语音鉴黄方案加强内容审核成为众多社交、音视频平台的刚需。

一站式智能语音识别解决方案,大力节约成本

无论传统语音审核还是人工审核方案,一直以来各平台都在积极寻找更高效的内容审核方式。在传统审核方案的对接模式中,企业想要同时上线直播、鉴黄等功能,需要分别对接CDN厂商、RTC厂商和内容审核厂商,并且额外支付CDN拉流成本,通过三步才能拿到内容审核结果,步骤繁琐、时间成本高且面临故障风险。而单纯使用人工鉴黄虽然对新型问题有较强的灵活性,但也面临人员流动性大、质量效率不稳定等运营成本。

声网Agora的一站式智能语音识别解决方案,将上述传统语音审核和纯人工语音审核进行了优化升级,通过自建的全球虚拟实时通信网络SD-RTN™,整合目前业界TOP3智能语音识别服务商,为企业提供可集成实时音视频、实时录制和实时智能语音识别的一站式服务,提供市面上最高效、便捷的智能语音识别技术。

同时,声网也是目前唯一一家打通人工智能、实时语音识别、实时音视频三大技术解决方案的服务商。使用声网的一站式服务,企业无需部署额外SDK、无需自己对接CDN厂商、更无需支付拉流成本,就可同时上线直播(实时音视频)和鉴黄(实时语音识别)功能,帮助企业大幅节省接入成本,真正做到一站式方便接入。

独特AI降噪技术,提升不良信息识别率

在目前流行的众多K歌平台,直播、语音聊天室中,为了追求内容效果,用户在UGC内容创作时普遍都会使用背景音乐或音效来营造氛围,这对平台进行语音识别增加了难度。

对于语音识别中常见的噪声、背景音等音质问题,声网的一站式智能语音识别解决方案融合声网Agora语音引擎与AI音频降噪算法,可提供去除背景音、环境音之后的高音质音频源,在原来算法的基础上将不良信息的识别率有效提高30%以上。

在语音识别过程中,对于有语义的声音,系统先将语音识别转成文字,然后再对文字内容进行识别;而对于无语义的声音,例如娇喘、ASMR中的色情擦边球等,则可以通过声纹检测来进行识别,再通过内容安全引擎判断是否包含涉黄违法内容。这样“双管齐下”的方式,可以避免娇喘等无语义声音的特殊性带来的审核漏洞。

声网通过深度学习语音识别技术与在线实时语音分析,智能识别语音环境中的广告、涉黄、涉政、暴恐、谩骂等不良信息,保障语音聊天室、娱乐直播等语音应用绿色安全。未来,声网还会联合更多业界知名智能语音识别服务商,为企业持续提供高效、严格的内容审核机制,促进网络生态健康发展。

【版权声明】凡本站未注明来源为"中国科学网"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站及其子站赞同其观点和对其真实性负责。其他媒体、网站或个人转载使用时必须保留本站注明的文章来源,并自负法律责任。 中国科学网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。

 
 
 

分类导航

关于我们 | 网站地图 | 网站留言 | 广告服务 | 联系我们 biz@minimouse.com.cn

版权所有 中国科学网www.minimouse.com.cn