当前位置:首页 » 新闻资讯 » 科技频道

华盛顿大学研发“空间语音翻译”技术:多人同时发言也能精准识别

分享到微信朋友圈

打开微信。点击 “ 发现 ” ,
使用 “ 扫一扫 ” 即可将网页分享至朋友圈。

发布日期:2025-05-25  来源:新疆黄页网  作者:吴霜
核心提示新疆黄页网讯:5 月 24 日消息,美国华盛顿大学的一项研究提出了一种可穿戴式空间语音翻译技术,能够通过双耳耳机在多人交谈环境中实时翻译,并可以保留每位发言

新疆黄页网讯:5 月 24 日消息,美国华盛顿大学的一项研究提出了一种可穿戴式“空间语音翻译”技术,能够通过双耳耳机在多人交谈环境中实时翻译,并可以保留每位发言者的声音特征与方位感

据 ITMedia News 昨日报道,借助这项技术,耳机能将每个人的话实时翻译成你的母语,同时保留每个人的声音个性和方向信息,让你清楚分辨谁在说什么。

与现有翻译工具相比,这项技术解决了两大难题:一是支持多人同时发言场景,二是翻译结果不再千篇一律,而是保持每个说话者独特的声音风格与方向。研究结合了音源分离、空间定位、实时翻译与双耳渲染等技术,构建出完整系统。

从报道中获悉,研究团队的三大技术突破包括:

  • 通过将空间细分为多个角度区域,并用神经网络识别每个区域内的潜在发言者,实现准确的音源分离与定位;
  • 构建可在 Apple 芯片上实时运行的语音翻译模型,能保留说话者的音质与情感;
  • 开发出双耳渲染方法,让翻译后的语音从原说话者方向传来,增强沉浸感。

在实际测试中,研究人员使用市售降噪耳机和双耳耳机,在苹果 M2 芯片上完成了从法语、德语、西班牙语到英语的实时翻译。10 名受试者在多种环境下测试后,系统展现出较强的通用性。

进一步的评估表明,29 名参与者普遍认为,新系统在多人交流场景中的表现优于传统翻译工具,不仅提升了翻译质量,也更易分辨说话者。此外,在空间感知实验中,用户能准确判断翻译语音的方向,与原声几乎无异。

 

---------------------------------------------------------
免责声明:
1.本文援引自互联网,旨在传递更多网络信息,仅代表作者本人观点,与本网站无关。
2.本文仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.除本站原创申明外的文章均来自互联网,如侵犯了您的版权请告之,我站将第一时间删除!


战略伙伴:
关于我们
公司简介
联系我们
人才招聘
商家合作
商家入驻
广告服务
企业建站
官方微信
帮助中心
纠错建议
免责声明
服务条款
付款方式
付款方式
Copyright©2009-2018 XJ114.NET All Rights Reserved. Powered by DESTOON
访问和使用新疆黄页,即表明您已完全接受和服从我们的用户协议。新ICP备12002129号-3