Pycharm打开(打印)大数据文件显示不全的解决方法

前言

昨晚写了个小爬虫,简单分析下发现可以修改请求的url,直接获取所有目标的数据。想先打印在控制台看看,发现打印的数据不全,一开始还以为被反爬虫了,获取的数据本身不全,后来将数据直接保存JSON文件(3兆多大小),用Ubuntu文档编辑器打不开(直接卡死),用vim打开发现数据完整(说明爬虫获取的数据本身没毛病),再在Pycharm用Python打开发现提示文件过大,打印在控制台也还是显示不全,在网上找了好久才找到了解决方法?。
在这里插入图片描述
在这里插入图片描述

正文

原来Pycharm IDEA对能关联的文件大小做了限制,主要是为了保护内存,默认值为2500kb,这对爬虫用户来说相当不友好,但时安装软件的时候也不提醒下?

在Pycharm菜单找到Edit Custom Properties…

在这里插入图片描述

追加以下字段

idea.max.intellisense.filesize = 20000
idea.max.content.load.filesize = 20000
idea.cycle.buffer.size = 20000

其中20000代表限制大小为20000kb(暂时应该够用?),可自行修改
在这里插入图片描述

重启Pycharm

在这里插入图片描述

搞定

在这里插入图片描述

总结

解决方法很简单,但是找到问题的来源很辛苦,一开始我以为是爬虫代码的问题,就反复修改请求头,换代理,掉了坑里好久,后来发现不是数据本身问题才慢慢恍然大悟,最终Google到了方法。所以要对自己的爬虫自信点,有问题全是IDEA的锅?

  • 29
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值