计算机语言学笔记(六)词类自动标注

6 词类自动标注

6.1 汉语中词的分类

汉语中词分类的依据主要是词的分布特征,或者说主要依据词的语法功能。
词的语法功能主要指词在句法结构里所能占据的语法位置。(充当句法成分的能力和组合成短语的能力)

名词通常表示事物的名称、动词通常表示动作和行为、形容词表示事物的性质和状态。
实词和虚词:
1.实词可以充当主语、谓语和宾语。虚词则不可以。
2.实词有实在的意义,表示事物、动作、行为、变化、性质、状态、处所、时间等。虚词基本只起语法作用。
3.实词多为开放类,虚词多为封闭类。
实词通常可进一步分成体词和谓词。体词可以做主语和宾语。谓词主要做谓语。
体词:名词(1)、处所词(2)、方位词(3)、时间词(4)、区别词(5)、数词(6)、量词(7)、代词(8)。
谓词:动词(9)、形容词(10)
虚词:副词(11)、介词(12)、连词(13)、助词(14)、语气词(15)
拟声词(16)、感叹词(17)([朱德熙,《语法讲义》,商务印书馆,1982])

如果同一个词具有不同词类的语法功能,则认为这个词兼属不同的词类,简称兼类。
对于兼类词,词类标注程序应根据上下文确定兼类词在句子中最合适的词类标记。

6.2 词类自动标注

基本方法:基于规则的词类标注,基于统计的词类标注,统计规则相结合的词类标注。
基于规则的词类标注程序工作过程

  1. 查词典,给句中各词标记所有可能的词类标记。
  2. 应用规则,逐步删除错误的标记,最终只留下正确的标记。
    规则用以删除和上
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
语言系统是指人类使用语言进行交流和表达思想的方式和规则。它包括语音、语法、词汇和语用等方面的内容,是人类思维和文化的重要组成部分。语言系统的知识模型是指人类对语言使用和语言规则的认知和理解。它是人类在使用语言时所依据的知识体系,也是人类语言学习和语言教育的基础。 语音是语言系统的基础,它包括语音的产生、传播和感知等方面的内容。语音知识模型包括如何产生语音、如何识别语音和如何将语音转换为具体的语言表达等方面的知识。 语法是语言系统的重要组成部分,它包括句子结构、词类、语法关系等方面的内容。语法知识模型包括如何构成句子、如何理解句子结构和如何使用语法规则进行语言表达等方面的知识。 词汇是语言系统的重要组成部分,它包括词汇的产生、使用和变化等方面的内容。词汇知识模型包括如何理解词汇的意义、如何使用词汇进行语言表达和如何掌握词汇的变化规律等方面的知识。 语用是语言系统的重要组成部分,它包括语言使用的情境、交际意图和语言规范等方面的内容。语用知识模型包括如何理解语言使用的情境、如何进行有效的交流和如何遵守语言规范等方面的知识。 在现代语言学中,语言系统和语言知识模型是相互关联、相互作用的。通过对语言系统的研究和分析,可以更深入地理解语言知识模型,并为语言教育和语言技术的发展提供重要的支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值