北京法院京牌小客车司法处置数据统计(Pandas)

最近我家参加了京牌小客车的司法拍卖。即参与京牌摇号失败的人可以参加司法处置的京牌小客车的竞拍。从2011年开始实施摇号政策以来参与摇号次数越多,越有可能成功竞拍。我们参与的是 2018年7月26日拍卖的这一次。在拍卖前夕,官网放出了此次参与竞拍的所有参与者的摇号次数,其中包括了大量的数据,有pdf 366页之多。所以我想利用Excel和Pandas对这些数据做一个整理和统计,看一看我家竞拍成功的可能性究竟有多大。

【代码在第二部分】

目录

1 数据预处理

2 利用pandas进行数据处理

3 遇到的问题


1 数据预处理

首先,看一下官网下载的数据是什么样的:

这是一个包含366页数据的pdf……我最想知道的是,有多少人比我家摇号次数多。

接下来,我们要把这个pdf文件转换成excel文件。我尝试了两种方法:

1、在smallpdf.com 上转换 -->失败

2、用高级版福昕阅读器转换,在软件的这个位置:

转换以后得到的Excel为(我去掉了头两行标题):

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值