Part-of-Speech 标记 含义

原创 2013年12月02日 22:36:04

一、33个

Definitions of Chinese Part-of-Speech
中文词性标注(33)
[1]     AD    副词  Adverbs
[2]     AS    语态词  --- 了
[3]     BA    把
[4]     CC    并列连接词(coordinating conj)
[5]     CD    许多(many),若干(several),个把(a,few)
[6]     CS    从属连接词(subording conj)
[7]     DEC   从句“的”
[8]     DEG   修饰“的”
[9]     DER   得 in V-de-const, and V-de R
[10]    DEV   地 before VP
[11]    DT    限定词   各(each),全(all),某(certain/some),这(this)
[12]    ETC   for words 等,等等
[13]    FW    外来词 foreign words
[14]    IJ     感叹词  interjecton
[15]    JJ     名词修饰语
[16]    LB    被,给   in long bei-const
[17]    LC    方位词
[18]    M     量词
[19]    MSP   其他小品词(other particle) 所
[20]    NN    口头名词、others
[21]    NR    专有名词
[22]    NT    时间名词  (temporal noun)
[23]    OD    序数(ordinal numbers)
[24]    ON    拟声法(onomatopoeia)
[25]    P      介词   (对,由于,因为)(除了 “把”和“被”)
[26]    PN    代词
[27]    PU    标定符号
[28]    SB    in short bei-const 被,给
[29]    SP    句尾语气词
[30]    VA    表语形容词(predicative adjective)
[31]    VC    是
[32]    VE    有(have,not have ,有,无,没,表示存在的词
[33]    VV    情态动词、  动词、possess/拥有 ,rich/富有,具有

CoNLL数据中使用的

摘自:http://blog.sina.com.cn/s/blog_4d76b9b50100elng.html
二、ICTCLAS中使用的

1.         名词  (1个一类,7个二类,5个三类)

名词分为以下子类:

n 名词

nr 人名

nr1 汉语姓氏

nr2 汉语名字

nrj 日语人名

nrf 音译人名

ns 地名

nsf 音译地名

nt 机构团体名

nz 其它专名

nl 名词性惯用语

ng 名词性语素

2.         时间词(1个一类,1个二类)

t 时间词

tg 时间词性语素

3.         处所词(1个一类)

s 处所词

4.         方位词(1个一类)

f 方位词

5.         动词(1个一类,9个二类)

v 动词

vd 副动词

vn 名动词

vshi 动词“是”

vyou 动词“有”

vf 趋向动词

vx 形式动词

vi 不及物动词(内动词)

vl 动词性惯用语

vg 动词性语素

6.         形容词(1个一类,4个二类)

a 形容词

ad 副形词

an 名形词

ag 形容词性语素

al 形容词性惯用语

7.         区别词(1个一类,2个二类)

b 区别词

 

bl 区别词性惯用语

8.         状态词(1个一类)

z 状态词

9.         代词(1个一类,4个二类,6个三类)

r 代词

rr 人称代词

rz 指示代词

rzt 时间指示代词

rzs 处所指示代词

rzv 谓词性指示代词

ry 疑问代词

ryt 时间疑问代词

rys 处所疑问代词

ryv 谓词性疑问代词

rg 代词性语素

10.    数词(1个一类,1个二类)

m 数词

mq 数量词

11.    量词(1个一类,2个二类)

q 量词

qv 动量词

qt 时量词

12.    副词(1个一类)

d 副词

13.    介词(1个一类,2个二类)

p 介词

pba 介词“把”

pbei 介词“被”

14.    连词(1个一类,1个二类)

c 连词

    cc 并列连词

15.    助词(1个一类,15个二类)

u 助词

uzhe

ule 了喽

uguo

ude1 的底

ude2

ude3

usuo

udeng 等等等云云

uyy 一样一般似的般

udh 的话

uls 来讲来说而言说来

 

uzhi

ulian 连(“连小学生都会”)

 

16.    叹词(1个一类)

e 叹词

17.    语气词(1个一类)

y 语气词(delete yg)

18.    拟声词(1个一类)

o 拟声词

19.    前缀(1个一类)

h 前缀

20.    后缀(1个一类)

k 后缀

21.    字符串(1个一类,2个二类)

x 字符串

    xx 非语素字

    xu 网址URL

22.    标点符号(1个一类,16个二类)

w 标点符号

wkz 左括号,全角:(〔     《【  〖〈   半角:( [ { <

wky 右括号,全角:)〕 ]}》 】〗〉半角: ) ] { >

wyz 左引号,全角:“‘『 

wyy 右引号,全角:”’』

wj 句号,全角:。

ww 问号,全角:?半角:?

wt 叹号,全角:!半角:!

wd 逗号,全角:,半角:,

wf 分号,全角:;半角: ;

wn 顿号,全角:、

wm 冒号,全角::半角: :

ws 省略号,全角:…… 

wp 破折号,全角:——   --   ——-  半角:---  ----

wb 百分号千分号,全角:%‰  半角:%

wh 单位符号,全角:¥$£  °   半角:$

摘自:ICTCLAS 文档

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

《Machine Learning is Fun Part 6: How to do Speech Recognition with Deep Learning》译文

最近看到一篇介绍语音识别的《博客》,感觉写得不错,正好自己也在搞语音识别,就把它翻译成中文,希望对语音识别感兴趣的同学有所帮助。(囧:原来网上早就有翻译了,白浪费两天时间翻译,大家选择性围观)语音识别...

CMUSphinx Learn - Basic concepts of speech

CMU Sphinx 官网的学习教程中 Basic concepts of speech 的翻译文章

Free Speech Concerns Ahead of Meeting With Muslim Nations on Religious Tolerance

Free Speech Concerns Ahead of Meeting With Muslim Nations on Religious Tolerance,sac hermes pas cher...

svn 文件状态标记含义 常见符号

svn常见符号 黄色感叹号(有冲突): 这是有冲突了,冲突就是说你对某个文件进行了修改,别人也对这个文件进行了修改,别人抢在你提交之前先提交了,这时你再提交就会被提示发生冲突,而不允许你提...

Gentoo Linux USE标记的使用含义

主机环境:Gentoo 11.2内核版本:Linux Kernel 3.2.1转载请表明http://blog.csdn.net/yming0221/article/details/7358185US...

Fundamentals of speech recognition

  • 2016-06-22 20:48
  • 13.29MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)