StreamSpeech

1年前发布 54 0 0

StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略，有效识别流式语音输入中的翻译时机，实现高质量的实时通信体验。该模型在CVSS基准测试中取得了领先的性能，并能提供低延迟的中间结果，如ASR或翻译结果。

收录时间：

2025-05-29

打开网站手机查看

智能翻译 # 多任务学习 # 实时翻译 # 语音合成 # 语音识别

StreamSpeech

StreamSpeech

StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略，有效识别流式语音输入中的翻译时机，实现高质量的实时通信体验。该模型在CVSS基准测试中取得了领先的性能，并能提供低延迟的中间结果，如ASR或翻译结果。

数据统计

相关导航

Microsoft Translator Pro

Microsoft Translator Pro 是微软推出的一款面向企业级用户的语言翻译应用，旨在帮助企业消除工作场所的语言障碍。这款应用提供了实时的语音到语音翻译功能，支持离线翻译，并允许企业IT管理员对应用的部署和使用进行精细控制。产品背景信息显示，该应用是微软在人工智能和机器学习领域的又一力作，体现了微软在推动跨语言沟通方面的承诺。产品价格为付费，定位于需要高效沟通协作的全球企业用户。

DuRT

DuRT 是一款专注于 macOS 系统的语音识别和翻译工具。它通过本地 AI 模型和系统服务实现语音的实时识别与翻译，支持多种语音识别方法，提高了识别的准确度和语言支持范围。该产品以悬浮框形式展示结果，方便用户在使用过程中快速获取信息。其主要优点包括高准确度、隐私保护（不收集用户信息）以及便捷的操作体验。DuRT 定位为一款高效生产力工具，旨在帮助用户在多语言环境下更高效地进行沟通和工作。目前产品可在 Mac App Store 下载，具体价格未在页面中明确提及。

ViiTor实时翻译

ViiTor实时翻译是由云上曲率公司推出的一款多语言AI实时翻译工具，旨在打破语言障碍，让全球沟通变得无比简单。ViiTor实时翻译利用先进的语音识别技术，支持近18种语言的流畅转译，具备即时翻译、对话翻译、语音识别等功能。无论是在国际旅行、商务会议还是多语言学习中，ViiTor实时翻译都能提供无缝的音频翻译、AR翻译支持。

VideoTrans视频翻译配音工具

VideoTrans是一款免费开源的视频翻译配音工具。它可以一键识别视频字幕、翻译成其他语言、进行多种语音合成,最终输出带字幕和配音的目标语言视频。该软件使用简单,支持多种翻译和配音引擎,能大幅提高视频翻译的效率。

AI Hear

AI Hear是一款在电脑本地运行的私有软件，它通过一键开启多语种实时翻译功能，帮助用户管理音频、译文和时间轴。产品不收集数据，保护用户隐私。它适用于多种场景，如线上会议、网课播客、游戏直播等，并且完全本地运行，相比市面上的实时翻译产品更具性价比。

Real-time-translation-typing

Real-time-translation-typing 是一款集成了实时打字翻译、语音实时打字和翻译、LOL 语音打字功能的软件。它通过AutoHotkey技术实现，支持多种翻译API，如搜狗、百度、有道等，为用户提供了高效、便捷的翻译体验。软件适用于需要快速翻译文本和语音的商务人士、学生和游戏玩家。

ChatX翻译

ChatX是一款多语言实时翻译工具，致⼒为企业提供跨境翻译与私域营销的全⾯解决⽅案。ChatX翻译可以覆盖WhatsApp、Telegram、Facebook等海外主流平台，⽀持⼀站式多账号管理和⾼效便捷的粉丝运营。同时，ChatX内置的SCRM客户管理功能与AI技术深度融合，显著提升企业沟通效率，推动可持续增⻓。通过精准的跨境翻译与营销策略，帮助企业拓展更有价值的全球客户，实现⽆缝的出海全流程营销。

Glotera AI

Glotera AI是一款能够实时翻译的桌面客户端，采用先进的AI技术，支持100多种语言，无缝跨语言沟通，提高工作效率。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...