最近我家参加了京牌小客车的司法拍卖。即参与京牌摇号失败的人可以参加司法处置的京牌小客车的竞拍。从2011年开始实施摇号政策以来参与摇号次数越多,越有可能成功竞拍。我们参与的是 2018年7月26日拍卖的这一次。在拍卖前夕,官网放出了此次参与竞拍的所有参与者的摇号次数,其中包括了大量的数据,有pdf 366页之多。所以我想利用Excel和Pandas对这些数据做一个整理和统计,看一看我家竞拍成功的可能性究竟有多大。
【代码在第二部分】
目录
1 数据预处理
首先,看一下官网下载的数据是什么样的:
这是一个包含366页数据的pdf……我最想知道的是,有多少人比我家摇号次数多。
接下来,我们要把这个pdf文件转换成excel文件。我尝试了两种方法:
1、在smallpdf.com 上转换 -->失败
2、用高级版福昕阅读器转换,在软件的这个位置:
转换以后得到的Excel为(我去掉了头两行标题):