文本处理
houxiaoqin
这个作者很懒,什么都没留下…
展开
-
python 对中文文件求交集、并集、差集
核心内容:1. set模块 intersection() ,union(), difference() 函数的使用2. 文件格式:一行一词, uft-83. 解决中文以str读入后转成list /set 时再以中文形式显示的问题 #!/usr/bin/python# -*- coding: utf-8 -*-import sysprint sys.getd原创 2016-03-19 15:32:51 · 1411 阅读 · 0 评论 -
词性标注说明
代码名称eng英文单词Ag形语素a形容词ad副形词an名形词Bg区别语素b区别词c连词Dg副语素d副词e叹词f方位词g语素h前接成分i成语j原创 2016-03-24 13:04:39 · 1372 阅读 · 0 评论