“嘿Siri,你能帮我做点什么?”
“……”
Siri的“甜美女声”,现在已经司空见惯了。
但如果没有女科学家Ann Syrdal的努力,这种“合成女声”可能还需要更长的时间。
遗憾的是,7月24日,74岁的Ann Syrdal去世了。
这位被网友谐音为“Answer doll”(问答娃娃)的语音合成专家,曾经是美国电话电报公司(AT&T,拥有贝尔实验室)的首席技术研究员。
在美国电话电报公司研究期间,她开发出了“第一个真正高质量的女性合成声音”,这才有了后来的Siri和Alexa(亚马逊的语音助手)。
于是《纽约时报》评价说:她是Siri和Alexa背后的那个人。
事实上,虽然语音合成技术早已有之,1939年,AT&T的贝尔实验室就已经开发出了首批合成语音。
但,这些语音合成技术(TTS)基本只能合成男性的声音。
往后的40年间,计算机技术突飞猛进,合成女性语音的技术却一直停滞不前。
Siri的开发者Tom Gruber曾经表示:“那些声音听起来就像机器人说话一样。”
而Ann Syrdal的到来,才让合成女性声音有了质地的飞跃。
让机器发出“自然的”女声
自20世纪80年代中期,Syrdal开始研发女性语音合成系统。
Syrdal的同事、语言研究员h.s.Gopal曾表示:“那时候,所有人都认为女声只是男声的高频版本,但这种想法根本不起作用。”
事实上,由于女性声音的特点,例如更高的音调和更多的气音,会导致在电话和计算机里,女性的声音比男声更加难听懂。
据研究发现,即使是真人对讲,女性声音被听错的概率要比男性平均高出33%。
举个例子,当你在做英语听力时,有没有感觉到,男声听力题往往会比女声更容易听懂?
这也是为什么,电话行业中大多数计算机合成的声音听起来像男性。
然而,语音合成领域不可能只有男声。
事实上,部分有发声障碍的女性,一直更希望能以女性的合成声音与外界沟通;此外,也有人对女声更加敏感。
就在1990年,Syrdal开发了一种可以合成女声的系统,通过优化数据库中的声音,将女性合成声音听错的几率从67%降到了40%。
这其中,一个名为Julia的女性合成声音,就是Syrdal开发出来的。
Julia合成女声.wav来自量子位00:0000:27
可以听见,无论是发音还是流畅程度,都已经达到了非常不错的水平,当然,语调还有一点奇怪,不过已经非常逼真了。
与直接创作语音相比,Syrdal选择将真人女性的语音片段组成一个大型数据库,在准确标记、确保语音质量的前提下,将它们拼凑起来,找到组合的规律,便于组成新词和新的句子。
此外,她还建立并测试了人类计算机模型,试图理解人类是如何识别各种语音的。
而她一直以来研究的目标,是将这个错误率降到33%以下,甚至比真人女性声音被听错的概率还要低。
1998年,Syrdal研发出的「自然之声」系统(Natural Voices),在国际语音合成器竞赛中获得了第一名,这是这项竞赛的一个拐点——因为它使用了女性的声音。
现如今,采用这项技术的Siri和Alexa,已经同时提供了女性和男性的声音。
而在美国与日本,Siri的女性声音已经成为了“标配”,几乎所有iPhone手机采用的都是Siri的女声。
2008年,Syrdal被任命为美国声学学会的研究员,以表彰她对女性语音合成领域所做出的贡献。
「自然之声」项目的负责人Juergen Schoeter表示:“就像是有什么力量一直驱动着她,促使她去优化女性声音的质量。”
合成女性语音之母
Ann Syrdal于1945年12月13日生于明尼阿波利斯(Minneapolis),她的父母于霍尼韦尔认识,这是一家二战前就存在的科技巨头公司。
她的父亲是一名开发真空管与电子技术的物理学家与工程师,在她2岁的时候就离世了,母亲将她抚养长大。
事实上,Ann Syrdal考上明尼苏达大学时,并没有考虑过从事科学工作,直到一位心理学教授请她帮忙做一个有老鼠参与的实验,她才意识到自己热爱实验室工作。
随后,她在明尼苏达大学获得本科与博士学位,此后在麻省理工学院从事博士后的研究。
也是在麻省理工学院和皇家理工学院,她开始研究人类语言的机制,此后一钻研就是大半辈子,一直到2015年,仍然在坚持不懈地发表论文。
事实上,Ann Syrdal发表的论文数量不多,在Researchgate上显示的一共有55篇,这些论文一共被引用了1100余次。
然而,她在语音合成领域上做出的贡献却有目共睹。
对于Ann Syrdal本人来说,选择科研的动力,来自于她在MIT工作的那段时间。
“无论在哪个领域,似乎都能在这里找到那个领域的世界专家,这种激励的感觉几乎让人难以夜寐。”
Ann Syrdal的女儿表示,因为癌症的原因,她于7月24日在加利福尼亚圣何塞的家中离世。
道翰天琼认知智能未来机器人接口API简介介绍
- 认知智能是计算机科学的一个分支科学,是智能科学发展的高级阶段,它以人类认知体系为基础,以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向,以感知信息的深度理解和自然语言信息的深度理解为突破口,以跨学科理论体系为指导,从而形成的新一代理论、技术及应用系统的技术科学。 认知智能的核心研究范畴包括:1.宇宙、信息、大脑三者关系;2.人类大脑结构、功能、机制;3.哲学体系、文科体系、理科体系;4.认知融通、智慧融通、双脑(人脑和电脑)融通等核心体系。 认知智能四步走:1.认知宇宙世界。支撑理论体系有三体(宇宙、信息、大脑)论、易道论、存在论、本体论、认知论、融智学、HNC 等理论体系;2.清楚人脑结构、功能、机制。支撑学科有脑科学、心理学、逻辑学、情感学、生物学、化学等学科。3.清楚信息内涵规律规则。支撑学科有符号学、语言学、认知语言学、形式语言学等学科。4.系统落地能力。支撑学科有计算机科学、数学等学科。
认知智能CI机器人是杭州道翰天琼智能科技有限公司旗下产品。认知智能机器人是依托道翰天琼10年研发的认知智能CI体系为核心而打造的认知智能机器人大脑,是全球第一个认知智能机器人大脑。具有突破性,创新性,领航性。是新一代智能认知智能的最好的产品支撑。 认知智能机器人技术体系更加先进,更加智能,是新一代智能,认知智能领域世界范围内唯一的认知智能机器人。 认知智能机器人是新时代的产物,是新一代智能认知智能的产物。代表了新一代智能认知智能最核心的优势。和人工智能机器人大脑相比,优势非常明显。智能度高,客户粘性大,客户满意度高,易于推广和传播等核心特点。 依托认知智能机器人平台提供的机器人大脑服务,可以赋能各个行业,各个领域的智能设备,各类需要人机互动的领域等。认知智能机器人平台网址:www.weilaitec.com,www.citec.top。欢迎注册使用,走进更智能机器人世界。
认知智能和人工智能的优劣势对比主要可以分为四大方面: 第一:时代发展不同。人工智能是智能时代发展的第二个阶段,认知智能是智能时代发展的第三个阶段。时代发展上决定了认知智能更显具有时代领先性。 第二:基础理论体系不同。人工智能的基础理论体系以数学为基础,以统计概率体系为基础。认知智能基础理论体系以交叉许可理论体系为基础。包含古今中外哲学体系,心理学体系,逻辑学体系,语言学体系,符号学体系,数学体系等学科。其基础理论体系更加具有创新性,突破性和领先性。且交叉学科理论体系的研究也是未来智能发展的大方向。其具体理论体系,还包含三体论(宇宙,信息,大脑三者关系),融智学,和HNC等。 第三:技术体系不同。人工智能的核心技术体系主要是算法,机器学习,深度学习,知识图谱等。其主要功用在感知智能。感知智能其核心主要是在模仿人类的感知能力。认知智能的核心技术体系是以交叉学科理论体系而衍生出来的。具体包含三大核心技术体系,认知维度,类脑模型和万维图谱。认知智能的技术体系核心以类脑的认知体系为基础。以全方位模仿类脑能力为目标。人工智能以感知智能为基础的体系,只能作为认知智能中的类脑模型技术体系中的感知层技术体系。类脑模型大致包含,感知层,记忆层,学习层,理解层,认知层,逻辑层,情感层,沟通层,意识层等9大核心技术层。因此人工智能的核心只是作为认知智能类脑模型中的感知层。因此在技术体系上,人工智能和认知智能基本上没有太多的可比性。 第四:智能度成本等方面的不同:人工智能产品的综合智能程度,普遍在2-3岁左右的智力水平。认知智能产品其智能程度大致在5-8岁左右。认知智能体系构建的机器人更加智能。且更省时间,更省人力和资金。优势非常多。具体请看下列的逐项对比。
道翰天琼CiGril机器人API
道翰天琼CiGril认知智能机器人API用户需要按步骤获取基本信息:
- 在平台注册账号
- 登录平台,进入后台管理页面,创建应用,然后查看应用,查看应用相关信息。
- 在应用信息页面,找到appid,appkey秘钥等信息,然后写接口代码接入机器人应用。
开始接入
请求地址:http://www.weilaitec.com/cigirlrobot.cgr
请求方式:post
请求参数:
参数 | 类型 | 默认值 | 描述 |
userid | String | 无 | 平台注册账号 |
appid | String | 无 | 平台创建的应用id |
key | String | 无 | 平台应用生成的秘钥 |
msg | String | "" | 用户端消息内容 |
ip | String | "" | 客户端ip要求唯一性,无ip等可以用QQ账号,微信账号,手机MAC地址等代替。 |
接口连接示例:http://www.weilaitec.com/cigirlrobot.cgr?key=UTNJK34THXK010T566ZI39VES50BLRBE8R66H5R3FOAO84J3BV&msg=你好&ip=119.25.36.48&userid=jackli&appid=52454214552
注意事项:参数名称都要小写,五个参数不能遗漏,参数名称都要写对,且各个参数的值不能为空字符串。否则无法请求成功。userid,appid,key三个参数要到平台注册登录创建应用之后,然后查看应用详情就可以看到。userid就是平台注册账号。
示例代码JAVA:
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
public class apitest {
/**
* Get请求,获得返回数据
* @param urlStr
* @return
*/
private static String opUrl(String urlStr)
{
URL url = null;
HttpURLConnection conn = null;
InputStream is = null;
ByteArrayOutputStream baos = null;
try
{
url = new URL(urlStr);
conn = (HttpURLConnection) url.openConnection();
conn.setReadTimeout(5 * 10000);
conn.setConnectTimeout(5 * 10000);
conn.setRequestMethod("POST");
if (conn.getResponseCode() == 200)
{
is = conn.getInputStream();
baos = new ByteArrayOutputStream();
int len = -1;
byte[] buf = new byte[128];
while ((len = is.read(buf)) != -1)
{
baos.write(buf, 0, len);
}
baos.flush();
String result = baos.toString();
return result;
} else
{
throw new Exception("服务器连接错误!");
}
} catch (Exception e)
{
e.printStackTrace();
} finally
{
try
{
if (is != null)
is.close();
} catch (IOException e)
{
e.printStackTrace();
}
try
{
if (baos != null)
baos.close();
} catch (IOException e)
{
e.printStackTrace();
}
conn.disconnect();
}
return "";
}
public static void main(String args []){
//msg参数就是传输过去的对话内容。
System.out.println(opUrl("http://www.weilaitec.com/cigirlrobot.cgr?key=UTNJK34THXK010T566ZI39VES50BLRBE8R66H5R3FOAO84J3BV&msg=你好&ip=119.25.36.48&userid=jackli&appid=52454214552"));
}
}