- 博客(1)
- 收藏
- 关注
原创 中文信息处理复习提纲
中文信息处理复习提纲第二章 自动分词(传统方法)2.1基本问题中文分词 自动分词:将中文文本字串转为词串的过程2.2分词规范常用分词规范 ——切分规范 现代汉语语料库加工规范 ——切分和标注相结合的规范 ——标注规范 切分单位:沿用“分词单位”,主要是词 **人名:**名人名字 地名:后面有省市不切分 **数量词:**数词和量词分开 重叠:AA,AAB,AABB等 附加:e.g 阿花 老张 复合:e.
2021-06-28 15:22:28 274
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人