众所周知,谷歌近年来在人工智能领域做了大量的实验。今天,谷歌在这一领域又向前迈进了一步。Google声称其ai驱动的语音合成系统tacotron 2最新版本基本达到了人类语音的效果。Google还上传了一些tacotron 2的语音样本,让大家体验最新的技术。
Tacotron 2是谷歌的第二代语音到文本转换技术,结合了两个深度神经网络,达到近乎完美的输出效果。神经网络的第一层负责将文本转换为声谱图(pdf),并渲染具有视觉效果的音频。转换成声谱图后,提交给wavenet,这是一个由deepmind开发的系统,deep mind是字母表的人工智能研究实验室。Wavenet读取频谱图并生成与之类似的声音元素。
![[科技资讯] 谷歌称语音合成系统Tacotron 2已达人类说话效果 [科技资讯] 谷歌称语音合成系统Tacotron 2已达人类说话效果](/uploads/diyimg/pf3u07jtrbv41up1puqxldc5pynysz.png)
语音转文本技术当然不是新技术。但谷歌声称其文字转语音技术高于市场上大多数同类技术,与人类发音没有区别。
Tacotron 2的发音会结合上下文,不同于市面上一个字一个字读的方式。此外,系统会对标点符号做出反应,并强调句子中的大写单词。
想体验这种对比音频的玩家可以点击这个链接。有两个语音样本,Google并没有指明哪一个是tacotron 2读的,哪一个是人类读的。但是如果你深入挖掘文件来源,你就能发现哪个音频来自tacotron 2。
听了语音样本,通过源代码模式找出哪个段落是tacotron 2写的,可以发现Google确实交出了一个惊人的答案。这个声音真的很接近人类的发音,虽然不完全一致,但是已经很接近了。比起市面上那些类似机器的技术,要好得多。而且我们还能听到文本中的标点符号和相应的节奏变化。
标题:[科技资讯] 谷歌称语音合成系统Tacotron 2已达人类说话效果
地址:http://www.heliu2.cn/xw/3397.html

![[科技资讯] 夸张!苹果自研GPU/基带/电源/触摸芯片:包圆iPhone](/images/defaultpic.gif)
![[科学技术]自动驾驶网约车上路还需“小心驾驶”](/uploads/diyimg/id37ntqgqcw493m4mz1iea4eqxtyvv-lp.png)
![[科技界] 索尼PixelOpus:要给游戏开发新人提供一个好环境](/uploads/diyimg/38voqeai43v5nyn7ua4scotk8nz2sg-lp.png)
![[科学技术]“涉海”成金融新热点 “十三五”千亿融资聚焦海洋](/uploads/diyimg/c8p2xvsnfaleelhdt01d7q12qvdctp-lp.png)
![[科技界] Letv超级电视漫威联名款即将预售,“乐米”之争进入白热化](/uploads/diyimg/7sq83imccg5o78fgrerwrw1mg7lcxu-lp.png)
![[科学技术]王金南代表: 科学确定污染源是治污必答题](/uploads/diyimg/37betzxgm8repx1r24l1ancf9uk3ri-lp.png)
![[科学技术]一步之遥 不改初心——记逐梦20年的现役航天员邓清明](/uploads/diyimg/90to4u5m65fm25ma704iwce7ldl360-lp.png)
![[科学技术]80毫秒时延 中新数据专用通道助力远程医疗](/uploads/diyimg/7sf2v7b1b2gap2cjlzrj9g4chgv0l6-lp.png)
![[科技界] 三星首款折叠屏手机销量超百万部,售价高达2000美元](/uploads/diyimg/d3hu4pq8uzzec1v2m5viq4sk9y41ir-lp.png)








