之前随便做了一下中金所杯的金融知识大赛的试题,低分飘过。看到复试名单,突然有一个想法,这个是pdf,万一有人想分析一下每个区域的人的分布,那怎么办。
pdf文件大概是这样的。
用的python库是pdfminer,这个库说实话还是有点复杂的,具体使用的时候,还是慢慢调试,print看看能够出来些什么,明白了规律之后再处理。本文作为一个记录。
#!/usr/bin/python
#-*- coding: utf-8 -*-
from pdfminer.converter import PDFPageAggregator
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage
fro