麻省理工公开课人工智能笔记十三

本篇主要讲声韵学的机制。基于英语

英语中dog的复数dogs最后发音为z,二cat的复数cats最后发音为s,为什么这样,基于区别性特征理论,如下

人发出的声音进入耳朵,得到处理,并生成一个区别性特征向量的序列,区别性特征是一个二进制变量,例如音是否有声,即发音时声带是否震动,震动就是有声+,否则就是无声-。最初的区别性特征理论及其推导有大约十四个这样的区别性特征,决定了你说的是什么音,例如说t(音标te)是一个二进制组合。由这些组合产生意思,然后反馈回来,因为有一些区别性特征并不存在。

典型单词的区别性特征音,例如apples

丛上往下依次是音节性(能否形成音节的核心)、有声性、连续性(发音器是否一直张开,没有阻碍),咝音(舌头形成窄道发出声音),这里列出的是一部分特征。然后需要设计一种机器,来识别或者发出这种声音。

机器如下

第一步,视觉感官生成两个苹果的概念

第二步,从库中找到apple,同时再复数寄存器中进行标记复数为+,库中apple这个词也会同复数寄存器联系,显示其是个名词+而不是动词-。

第三步、信息流动,缓冲器中出现APL,同时,复数寄存器同约束条件进行联系,告知其为复数

对apl三个进行判断,只要三个端口中有一个不符合规则,就什么都不做。本例中p不是有声的,l没有z音,


第四步、缓冲器向左流动

第五步、判断L是有声的,由已知这个词是复数,结合有声性和复数性

第六步、填入z,发出声音。

注意apples的发音中音节单词是APLZ

如何学习那些规则呢,例如以dogs和cats为例,如何学习什么是z,什么是s

考虑前面列的四种特征。我们重点关注一个词如何得到z音,一个词得到s音

这是一个稀疏空间,过程如下

首先收集正例+和反例-,从正例+开始,选一个正例+作为种子,下一步推广,选择矩阵中的一些音素,不再考虑他们。例如从正例+开始,不再考虑就改变为点,也可以从负例开始,不再考虑改编为点。一直推广直到反例也被包含进来。

为什么这能够奏效,下面是论证。

这是一个稀疏空间,对于高维稀疏空间,很容易就能将一个超平面放到空间中,将一组例子和另一组例子区分开来。

对于一维空间中,当两组稀疏点重合时,无法区分

但当放在二维和三位空间时,则很容易区分

空间维数越高,找到区分数据的平面就越容易,这就是理论的发明者认为能够使用很少可能音素空间的原因,能找到一个平面将他们区分开。这让事物具有可学习性。这是一种可能性。

另一种可能性,如果你有一个稀疏空间,14维的高维空间,而且你语言中的40个点,随机分布在整个空间中,那么根据中央极限定理,他们之间的距离会大致相等。这就确保了音素再说话时很容易区分。

大卫马尔的问答法,当你处理AI问题时,

1、明确问题

2、设计一种表示方式适用于问题

3、确定一个处理方式,思路或方法

4、选一个机制或者设计一个算法

5、实验

过程不一定完全遵循上面的步骤,但不能只抓住一个机制不放。处理音韵学问题就是应用这套方法的典范。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值