K8一触即发人生赢家官方网站
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • K8一触即发人生赢家官方网站带你走进互联网职业之路

    2026-04-12 17:17

    互联网网站设计运营人员要具备的能力包括策划、写作、沟通协调、网站设计数据分析、渠道拓展等。一般发展路线为:运营支撑—运营专员—运营经理—运营总监。分步解析如下:1、运营经理,通常是一个小组

  • APP开发对企业的重要性

    2026-04-09 18:35

    移动互联网浪潮发展的越发迅猛,一些中小企业想提高自己的竞争力在互联网领域分得一杯羹,对APP开发都想做到专属,在移动互联网时代抓住机遇。由于APP应用越来越多,也受到众多商家的投资。今天{{

  • 今天分享几个网页设计的实用技巧

    2026-04-05 09:36

    不知道大家知不知道3A级网站开发设计要求。没有人想在浅绿色背景上阅读亮蓝色字体,因为没有足够的对比度,文字难以阅读。同理,柠檬绿背景也不适合搭配粉红色的文字;所以我们在设计网站开发网页的时候

  • 不同的行业如何选择合适的网站风格

    2026-04-03 12:28

    每个行业,因服务不同,产品不同,网站风格有很大的差异性。网站风格有的轻佻活跃,有的官方低调,有的颜色鲜艳,有的精美简洁。所以在建站时,如何选择合适的网站风格是一件非常重要的事情,必须提前考虑

  • 网站建设对企业的好处 网站如何排版布局

    2026-03-31 22:24

    在互联网的冲击下,传统企业不得不通过转型网络营销的模式适应社会的发展,很多企业都选择通过网站设计的方式转型网络营销。今天,K8一触即发人生赢家官方网站小编就与大家分享下企业进行网站建设的有哪些好处。1、提升

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-03-22 17:40
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。