“Ran out of input” while use WikiExtractor

当使用Wikipedia Extractor(GitHub - attardi/wikiextractor: A tool for extracting plain text from Wikipedia dumps)工具处理所下载的wiki dump文件(https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2)时,当我执行python命令:

python Wikiextractor.py -b 10M -o zh_extracted zhwiki-latest-pages-articles.xml.bz2

时,出现了

EOFError: Ran out of input

的错误。

经过百度和google,在wikidata - "EOFError: Ran out of input" while use Wikipedia Extractor as a parser for Wikipedia Data Dump File - Stack Overflow中找到了解决方法:可能是因为windows系统的stringIO问题导致,如果换用linux系统运行的话就不会有问题。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
"Ran out of input"错误通常表示代码试图读取数据时已经到达了文件的末尾或者没有更多的输入可用。根据引用和引用的描述,这个错误可能有以下几种可能原因: 1. 在使用shelve库时,可能是因为输入数据不完整或者已经被读取完毕导致的。这时候可能需要检查输入数据是否正确并完整。 2. 在遍历testloader时,可能是因为数据加载器中的数据已经被全部读取完毕导致的。这时候需要确保数据加载器中仍然有数据可用。 3. 在打开文件时,可能是因为文件已经读取完毕或者文件被修改导致的。这时候可以尝试删除文件并重新运行程序。 综上所述,当出现"Ran out of input"错误时,需要检查输入数据的完整性,确保数据加载器中有可用的数据,并排除文件被修改的可能性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [python Ran out of input 异常解决](https://blog.csdn.net/jacke121/article/details/124225002)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [Python错误:Ran out of input解决办法](https://blog.csdn.net/weixin_43596804/article/details/121369608)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值