跳过从文本到语音输入的繁琐 脸书最新技术可更好创建语音识别

据外媒,Facebook已经开发出一种建立不需要转录数据的语音识别工具的方法。全新的系统可以使技术摆脱对文本到语音输入的依赖。

这项耗时的任务涉及人类聆听和转录数小时的音频,这是一个单调的过程,必须对每种语言进行重复。而Facebook的系统则纯粹从语音音频和未配对的文本中学,使其更好地了解人类交流的声音。

据悉,Facebook的模型基本上依赖于由 "生成器 "和 "辨别器 "组成的生成网络(GAN)之间的反馈回路。

前者“吐出”上传的语音模式的代表,看起来完全是胡言乱语,直到它们被放到相应的鉴别器网络中,后者充当了某种翻译。同时,Facebook还输入由人类编写的额外文本,以帮助生成器收集与现实世界的差异。

推荐DIY文章
iPhone14系列进行专业跌落测试 结果表明Plus比ProMax更坚固
皓丽2022线上发布会:5大新品亮相,多位行业大咖与合作伙伴助阵!
最新一届小鹏汽车科技日即将到来 主题已定为预见与不止遇见
传小米汽车工厂将在2023年中获得造车资质 申请专利已上百
Win7系统打开IE浏览器后页面自动关闭的四种解决方法-重点聚焦
联想win8重装系统步骤 联想win8系统重装教程-世界速看
精彩新闻

超前放送