(3)形态学:语言的词汇----NLP的语言学基础

本文探讨了语言学中的词典构造、词类划分,特别是实义词与功能词的区别。深入研究了语素、形态学,包括黏着语素、自由语素、词缀和构词规则。此外,还讨论了新词创造的不同方式,如复合词、截短词和错误派生。形态分析在识别语素和理解词汇形态变化中的作用也被强调。
摘要由CSDN通过智能技术生成

术语:

  • 词库:心理词典
  • 正字法: 心理词库中为每个词独特的语音表征、发音、语义的方法
  • 语法范畴/语法类:词的性质

 

1 词典

2 实义词和功能词

  • 实义词/开放类:名词、动词、形容词、副词
  • 功能词/功能词/封闭类:连词、借此、冠词,界定语法关系,很少或根本没有语义

  • 人脑处理功能词和实义词的方法不同

3 语素:意义的最小单位

  • 形态学:对词的内部结构和构词规则的研究
  • 词汇可以分解为语素,体现了人类语言的另一个特征:离散性(BPEsub_words的语言学原理?

3.1 黏着语素与自由语素

3.1.1 前缀和后缀

3.1.2 中缀

3.1.3 外接缀/非连续语素:同一个语基语素的开头和末尾附加上的语素

3.1.4 词根和词干

  • 词根:无法进一步分析为更小成分,具有实际意义词汇的语素
  • 词干:词根语素和词缀的结合

4 构词规则

4.1 派生形态学

  • 将黏着语素加到一个词基上:pure + -ify --> purify

4.2 词的层级结构

  • 用树形图来表征词(以及句子)的层级组成
  • 有时存在歧义问题,类似if-else嵌套时的匹配问题

4.3 派生语速再论

  • 一些词通过形态规则进入词库,但是另一些会被堵塞:commum ist为词,commum ian 不是

4.4 词汇缺位

  • 合式但并不存在的词

4.5 规则的能产性

  • 一些形态规则具有能产性:它们能够自由加以运用,从而将清单中的自由语素和黏着语素组成新词

5 手语形态学

6 创造新词

6.1 来自名字的词

6.2 逆构词

  • 一个新词因为不正确的词汇形态分析进入语言,eg. 错误认为-er为后缀,从peddler派生出peddle

6.3 复合词

6.3.1 复合词的意义

  • 不总是组成部分意义的总和
  • 表现出组成成分之间的其他语义关系

6.3.2 复合构词的普遍性----存在于各种语言

6.4 拦截词

  • 由两个词构成,一部分合成之后被删除

6.5 缩减词

  • 截短词:将较长的的词截为较短
  • 缩略词:提取首字母

7 曲折语素

  • 有严格语法功能的黏着语素,标明“时态、数、性、格”等的黏着语素
  • 派生语素是没有屈折变化的 词缀,曲折语速标志着语法关系

7.1 例外与异干替换

  • 异干替换:不规则形式,如go-went

7.2 形态和句法

  • 一些语法关系可以或者通过屈折形式或者句法来表示

8  形态分析:辨认语素:寻找反复出现的形式

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值