潘悟云教授“新世纪语言学的转型“讲座笔记

教授讲座的内容主要分为三块:

  1. 什么是科学?语言学是否是科学?
  2. 关于大数据在语言学研究中的应用
  3. 潘教授和他的学生目前做的一些成果

什么是科学?

科学可以分为两类,经验科学和逻辑科学。其中逻辑科学包含两类:数学和逻辑(其本质是相同的), 这类科学具有的特性是具备自相容性,结论和推断只要在其自己建立的体系结构中是完备的,即使与观察到的事实不符,甚至某些体系见看起来相互矛盾,也是正确的。比如三角形内角和,在希尔伯特空间中=180度,在罗氏空间(前苏联数学家)中>180度,在某空间中<180度。而经验科学则是根据我们在现实中观察到的一些现象,提出自己的一些假设和猜想( 即命题),然后再验证这些命题是否成立。 因此,区分科学和不是科学(注意!”不是科学“<>"伪科学"!!),关键在于每个命题是否具有证伪性!科学的作用在于利用这些已经被证实的经验和规则来帮助我们解决问题。比如开一辆车去昆山,假设距离110km,车速55km/h(假设匀速),我们没必要每分钟都看是不是到昆山,而是在大约2小时左右的时候看看是不是到了。
上面提到区分科学关键在于具有可证伪性,比如物理是科学,因为物理学的每个结论理论上我们都可以通过实验和观察证伪(即使是黑洞,只要我们能发现从在所谓的奇点,就可以证明),宗教学不是科学,因为你没办法证明上帝是不存在的。潘教授认为语言学是科学,因为每个观点可以从文献或其他渠道获得证明。比如各地方言的起源等。

关于大数据在语言学研究中的应用

大数据对研究问题的影响
  1. 允许数据不精确,但由于数据量非常大,从数量上弥补了质量的不足。
  2. 探讨相关关系,而非一味追求因果关系(研究某些问题时,从某些易于获取、数据量大的特征上去探究目标特征研究的问题)

由于语言学很多问题获取数据非常困难,比如为了调研各地方言,政府仅在上海一地有10个调研点,1个调研点花费就5万多,全国所有调研点加起来花费近1亿! 实际上,很多时候我们在获取目标数据非常困难,成本非常高的时候,可考虑从某些获取容易,数据量大的数据,尽管该指标可能不是非常精确,但利用其量的优势,从而实现质的突破。

案例1:研究南方语系繁杂的起因

主要从各地方言音调中的差异,通过不同汉字(5000多字)在方言中的发音(如相同韵母)进行统计,研究先民方言。中国方言主要集中在东南方,如吴语,粤语,沪语,越语,客家话,闽南话等。而从地理角度上观察,这些语言传播区域恰好是在中国三国时期的东吴领地。有历史我们知道,在汉及汉以前,该地区主要是被我们称之为”百越“的众多少数民族聚集地,并且之前更多是以附属国以及安抚的形式统治,实际文化交流并不频繁(由古人对此地的吐槽也可以看出点端倪)。而一直到东吴,孙氏在此地建立有效政权,并把行政中心迁移到南京,从而使汉文化与当地文化有了更深层次的交流。由于汉文化对周边文化的强势地位(无论经济、文化、军事均遥遥领先),少数民族必然会开始一个汉化过程,包括学习汉语。而现代方言中保留的与普通话差异较大的地方,很可能就是当地先民原始方言中的某些保留成分。(从东吴自北向南,我们还可以发现,越往南,其方言与普通话差异程度越大,推测是越往南其与汉文化的交流越少,从空间上某种程度也是汉文化传播的路线)潘教授从发音声调的统计规律(如上海话中的1-3调)、不同汉字各地使用的声韵母等研究先民的语言,这是通过文献很难获得的,而实地调研成本又过高(大数据在语言学的应用)。感想:经济实力决定语言渗透力啊!看看今天的粤语和沪语在当地受到重视的程度(按潘教授的意思,其实都是当地原始先民学习汉语不到位,类似于印度英语 ̄□ ̄||),而内陆地区普通话重视程度远超”土话“;以及天朝人民对英语的热情........

案例2:人类语言传播路线

主要着手点是从原始人迁徙路线入手,研究沿该迁徙路线,不同人种的语言中声调、字母等的相似性(间接验证了人类起源于非洲)。人类起源于非洲,到亚洲的路线有两条:

一条是从西边过来,路经西藏,到中国(研究汉语和藏语使用字符的相似性),另一路是从南边南亚上来到越南、海南、广东等地(也是研究他们语言的相似程度)。有一个有意思的 模型:


类似的,可以从语言传播角度(如字母相似程度),研究人类迁徙路线。直接研究人类迁徙路线,所拥有的资源有限(考古发现,历史文献==0),但利用现有的资源:不同民族的语言!可以更方便的研究这一问题,而且成本更低!


潘教授及其学生的研究成果

主要包括利用声调对方言进行纠错,声调研究各地方言、对古文进行识别等,类似于自然语言处理,略。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值