能听懂口音的开源语音系统来了:OpenAI 出品,支持 99 种语言
2022-09-25 20:56:45
  • 0
  • 0
  • 0

近日,OpenAI 宣布新开源了一个名为「Whisper」的语音识别系统,称其在英文语音识别方面的稳健性和准确性接近人类水平,还能识别不同的口音和专业术语。消息一经发布,在推特上收获了 4800+点赞和 1000+转发。

Whisper 最大的特点是使用了超大规模训练集。具体来说,它使用了从网络上收集的长达 68 万小时的多语言、多任务数据集,涵盖了不同环境、不同录音设备下的多语言音频,内容十分多元。

其中,65% 左右是英语音频和匹配的英语文本,大约有 43 万小时。大约 18% 是非英语音频和英语文本,其余 17% 则是非英语音频和相应的文本,非英语部分共包含 98 种不同语言。(来源:量子位)

 
最新文章
相关阅读