问题
直接加载哈工大LTP中的词性标记模型,对已经分词的词语列表words进行标记,出现了标记后标记列表内容为空现象,正常情况下标记列表的长度与分词词语列表长度一致,并存有标记结果。
如图,出现错误" Index out of range "
出现原因
当词语为空时,LTP词性标记模型无法成功标记并抛出Index out of range异常。
解决方法
删除所有空行
- notepad++文档打开分词文档(程序中是从文档读取并存储到列表)直接删除空行
- 编写写入分词结果到文档中时过滤掉空行,或者在读取时过滤
正确结果