统计自然语言处理基础-第三章 语言学基础(笔记)

3 语言学基础

语言学概念+语法(句子结构)现象(附着歧义、短语结构)+词法(词语形成)+语义

3.1 词性和词法

句法=语法类=词性(POS):按照词的语法结构和典型的语义类型分类,类别的名称

开放类别=词汇类别:名词(人、动物、概念、事物)、动词(表达动作)、形容词(描述名词的属性)

封闭类别=功能类别:介词、限定词(包括类似of,on,the,a的词)

判断词是否属于同一类别的最基本方法是替换测试

POS标记:命名词语类别的缩写集

词语类别与构词过程是系统相关的,懂得了构词过程,就能够推导出新词的许多语法和语义属性

构词过程主要类型:

  1. 变形(对词根形式进行系统的修改,通过加前缀或者后缀来指明语法结构的不同,变形并不能显著改变词语的类别和语义,但是修改了一些特性,时态、数目或者复数形式)

  2. 派生(导致了语法类别的根本改变,而且涉及到了含义的变化)

  3. 复合(将两个或者多个词合成一个词)

3.1.1 名词和代词

名词指世界上的实体,人 动物 事物 只有一种变形,复数形式;另外还有两种跨语言的常用的名词变形,性别和格

​ 英语中不存在性别变形形式,但是第三人称单数代词有不同的性别形式 he she it

​ 当名词在句子中具有不同的功能(主语,宾语)时,该名词表现为不同的形式:格,英语唯一指明了所有格

代词是一个独立的小类,类似于变量,指代上下文中比较明显的人或物,代词分人称(1 2 3),代词是英语中唯一一种在在作为句子主语和宾语的时候形式不一样的单词(主格和宾格)。

代词也具有特殊的形式,1 所有格代词中的代词指代的对象是一个所有者,这是所有格形式my car,2 英语还有另一种所有格形式,称为第二所有格人称代词,用于of的宾语描述的是所有者时a friend if mine。3 还有反身代词(常用于指代语,指代文中某个和他距离非常近的对象,通常是句子主语)

人称代词用于指导前文中稍微远一点的人或物
在这里插入图片描述

3.1.2 名词附属词:限定词和形容词

其他的几种词性标注一般都会伴随着名词出现。

限定词描述了名词的特指。限定词的一个子类是冠词,冠词the表明我们正谈论一些已经知道或者可以唯一确定的人或者事物,a/an 值得是我们前面没有提到的人或者事物。其他的限定词包括指示代词,this和that。

形容词用来描述名词的属性,修饰名词的用法被称为属性或者修饰词,形容词还有一种表语用法,用做be的补语。</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值