关于裁判文书网的一些建议

博主分享了在使用selenium爬取裁判文书网时遇到的问题及解决方法,包括chromedriver被检测导致的页面空白、点击元素失效、批量下载限制及选择框操作等。建议设置等待时间、转换exe文件、定位并点击选项来解决问题。同时提到数据提取和分类的建议,鼓励刑法专业人员进行研究。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于裁判文书网的一些建议

有部分小伙伴私聊我一些文书网的东西。原因应该是我关于文书网批量下载的博文,写得太过简单。但我认为实现思路其实就这么简单,登录爬取,就没其他操作可言了。今天整理一下大概的问题。

数据爬取需谨慎,学习就学习,知道怎么行就好。

1. 为什么我的selenium在跳转页面后就是空白?

这个问题吧是chrome driver被检测了,这个很常见。

解决方式:下载可以将exe文件转换为16进制文件的软件。通过搜索 $cmd_ 把搜到的改为 $xxx_ 就行了。

2. 下载按钮和批量框,点击不上?

这个问题,可以设置等待时间,并且在点击前做一个检测,检测一下所选tag存在否。检查一下xpath。

3.只能下600个?

这里批量下载是只能下600个。但是你可以根据条件做限制,这样就能获取更多了。

4. 选择框?

关于选择框那儿确实不是我们常见的select下拉框选项,但总体一样,你只需要定位到每一个选项进行click点击事件,就能得到树枝信息了。

5. 将数据信息提取并分类?

对不起,没做过没研究。这个我建议刑法专业小伙伴,可以整理整理,既能提高技能,又能为做个总结。

由于没深入研究所以有问题了再看看。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值