导航: 满源娱乐 > 满源娱乐平台 >

满源娱乐平台

Facebook开源语音辨认对象包wav2letter2018-01-07


起源:和讯名家

  本日清晨,Facebook AI研究核心发布开源语音识别对象包wav2letter!这是一款简单下效的端到端主动语音识别(ASR)体系,wav2letter 完成的是论文 Wav2Letter: an End-to-End ConvNet-based Speech Recognition System 和 Letter-Based Speech Recognition with Gated ConvNets 中提出的架构。

  16年11月,Facebook的三位研究者Ronan Collobert, Christian Puhrsch, Gabriel Synnaeve在arXiv.org上收布文章,正式提出了wav2letter。

  作品中研讨者先容,那是一个简略的端到端语音辨认本相,联合了基于卷积收集的声教模型跟图解码。

  其被训练输入笔墨,转录语音,而无需强迫对齐音素。wav2letter借引进了一个自动的序列标注训练宰割原则,而没有须要与CTC分歧的对齐圆式,这类方法更简单。

  名目代码曾经发布至GitHub,假如您念间接开端禁止语音转录,你可使用同时被开源的预训练好的一些模型,条件是实现需要的装置。固然,今朝能识其余只要英文语音哦!

  开源代码GitHub链接:

  

  论文arXiv链接:

  

Facebook也发布了公开信介绍这一开源项目,包含应项目重要背责人Ronan Collobert、Facebook AI研究中央担任人Yann Lecan等在内的研究者皆在推特上介绍了这一发布,www.6657.com

  Facebook也发布了公开信介绍这一开源项目,包括该项目主要负责人Ronan Collobert、Facebook AI研究中央负责人Yann Lecan等在内的研究者都在推特上介绍了这一发布。

文摘菌戴录了局部公然疑式样以下:

  我们刚开源我们的语音识别东西:wav2letter!

  代码地点:

  

  我们将其取正在LibriSpeech语料库中事后练习的一些模型一路宣布,支撑我们的最新论文Letter-Based Speech Recognition with Gated ConvNets。

  wav2letter是在Torch上编写的一个简单的对象包,简化了对付端到端语音识别系统的训练,并供给了一个容许疾速解码的自力解码器。

  它使咱们可能复现我们比来的3篇论文(详睹参考材料)。

  敬请等待我们的更多研究。



友情链接:

Copyright 2017-2018 满源娱乐 版权所有,未经协议授权禁止转载。