MIT的《深度学习》精读(19)

Of course, it can be very difficult to extract such high-level, abstract features from raw data. Many of these factors of variation, such as a speaker’s accent, can be identified only using sophisticated, nearly human-level understanding of the data. When it is nearly as difficult to obtain a representation as to solve the original problem, representation learning does not, at first glance, seem to help us. 

当然,从原始数据里抽取如此高级的、抽象的特征值是非常困难的。许多变化的因素是要求复杂的、接近人类水平的数据理解能力,才可以抽取出来,比如说话者的口音。当我们解决这些困难的问题时,抽取这些特征值就非常困难,凭感觉上来看,特征值学习算法也显然无济于事。


如何从普通话口音判断说话者是哪里人,这个问题的核心其实牵涉的是语言学上的二语习得机制,也就是人怎么学会第二语言的规律。首先要了解第一语言(一语)和第二语言(二语)两个概念。第一语言一般指母语或在儿童语言发展关键期内学会的语言,不一定只是一种,有些多语家庭的儿童可以有多个一语。二语则一般认为是在超过了关键期(有研究认为青春期是个临界点)之后才学会的。外语就属于二语。


二语习得一般都无法再达到与一语同等的流利度,基本都会产生“负迁移”现象,尤其语音上更明显,也就是会将后来学习的目标外语中某些音位替换为母语中类似的音位,之所以会这样,或因耳朵已习惯了母语的语音系统而不能分辨外语中差别不明显的某些音位,也可能是发音器官习惯了母语音系而无法发出某些外语语音的结果。这其实就是口音产生的原因,即由于一语对二语的影响而形成的。所以口音大多出现在青春期之后才学的语言中。


普通话口音只出现于母语非普通话的人群中,是人们把普通话当作第二语言学习的过程中被来自各自母语(很多时候是方言)音系影响的结果,母语某些典型语音特征被负迁移到普通话上面了。因此某一特定方言区的人,尤其是青春期之前没有接受正规普通话教育或没有生活在有充分正确的普通话语音输入环境中的人,其所说的普通话就会带上从母语方言里迁移过来的某些特色的音。(但要注意,这并不是说儿童必须从小就摒弃方言、只接受单纯的普通话单一语言教育,因为前面说了,第一语言其实可以有多个,只要在青春期前有正确语言输入而自然习得的,都可以达到无口音,不论是单语、双语还是多语)


各个地区由于其母语的音系特征各自有别,因此其对普通话学习产生的迁移音位也就各有差异,这就形成了带有各地特色口音的地方普通话(古代叫做蓝青官话)。由于这种腔调特征是带有地区聚合性的,因此也就能给我们提供某些判断说话人来源地的线索。


但判断的前提,必须是你能对全国各地的语言/方言音系本身的特征有个整体、系统的了解,比如某个方言区、片或点的音系特征是怎样。打个比方,闽方言区大多数的点的音系中都有缺乏唇齿清擦音[f]的特征,这些地区的人学普通话的时候,就很可能听不出[fu]和[hu]的区别而混淆两者,也可能发音时口腔和舌齿唇等无法轻易自然地发出[f]音,而会习惯性用母语音系中的[hu]这个近似的音位组合去替代。于是就会出现闽式普通话中[f]出现频率远低于[hu]甚或完全缺位的现象,比如闽系的潮汕本地人说普通话常见把房子说成黄子、风景说成轰景的情况。


这类地方普通话口音特征,可通过对比标准普通话和各地音系而推测出最容易发生负迁移的点,而一旦知道了这些点,就有可能用逆推法(溯因推理)来推测说话人来自哪里。但要注意的是这种溯因推理在逻辑上是非必然的。简单说,逆推就是我知道A会导致B,现在我看到B出现了,所以我猜其原因是A。但这只是一种可能,不是必然。因为我们无法排除也许还有其他原因如C或D也会导致B。


比如有时候我在广东省内听到说话人出现fu>hu, zh\ch\sh>z\c\s、yu>yi、an>ang的情形,很可能就会判定对方是闽系潮汕人,因为潮汕口音的普通话就有这些特征,但其实广东省内其他闽语也多数有类似特征,比如湛江的雷州话。所以有时会出现我问对方是否潮汕人,对方却说自己是湛江人的情况。这就是逆推的或然性。


从口音逆推说话人来源地的原理大概就是如此。有兴趣者也可以去找一些方言学的概论性资料,比如北大李小凡、项梦冰的《汉语方言学基础教程》,或者去找他们的汉语方言学课件,一般都有总结各个大方言区的音系特点,不过这些大多用的是语音学和音韵学的术语,不一定很容易懂,而且也不一定会细化到各个方言点。 最后,为了增加逆推结果的准确率,还可在语音特征之外辅以词汇、语法方面的判断,比如观察对方是否使用了一些地方性的特征词汇(各地方言有自己的特征词,如可参看《现代汉语方言核心词特征词集》),或者出现了某些地方特征语法形式(比如在说普通话时使用粤语常见的特色语气词,或习惯使用“先”后置于动词的做法,就会是判断对方来自粤语区的某种佐证)。这些和口音方面的线索综合起来考虑,就会判断得相对准确一些。






——转载自ONE

1. TensorFlow API攻略

2. TensorFlow入门基本教程

3. C++标准模板库从入门到精通 

4.跟老菜鸟学C++

5. 跟老菜鸟学python

6. 在VC2015里学会使用tinyxml库

7. 在Windows下SVN的版本管理与实战 

 http://edu.csdn.net/course/detail/2579

8.Visual Studio 2015开发C++程序的基本使用 

http://edu.csdn.net/course/detail/2570

9.在VC2015里使用protobuf协议

10.在VC2015里学会使用MySQL数据库


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

caimouse

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值