用NLTK处理自己的文件

>>> import nltk
>>> from nltk.corpus import BracketParseCorpusReader
>>> corpus_root = r"C:\Program Files\360\360zip\LiveUpdateLog"
>>> file_pattern = r".*.log"
>>> ptb = BracketParseCorpusReader(corpus_root, file_pattern)
>>> ptb.fileids()
['360zipUpdate.log', 'P2SP_360zipupdate.log', 'P2SP_360zipupdate22ss.log', 'eretertwer.log', 'fergwegjwelkg.log', 'tqos_log.log']
>>> len(ptb.sents())
0
>>> ptb.sents(fileids='tqos_log.log')[19]

Traceback (most recent call last):
  File "<pyshell#7>", line 1, in <module>
    ptb.sents(fileids='tqos_log.log')[19]
  File "C:\Python27\lib\site-packages\nltk-2.0.4-py2.7.egg\nltk\corpus\reader\util.py", line 264, in __getitem__
    raise IndexError('index out of range')
IndexError: index out of range


 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值