以读取IPO正常审核状态企业基本信息情况表为例,
这个帖子介绍了表格的下载http://blog.csdn.net/tiantiantdx/article/details/79401698
import os
import re
import xlrd
path='C:\\Users\\jack\\PycharmProjects\\untitled'
# 根据模糊文件名查找文件
file=re.compile(".*审核.*企业.*")
# 查找路径下所有文件
allfile=os.listdir(path)
for s in allfile:
if file.match(s):
filename=file.match(s).group()
break
# 打开excle文件
workbook = xlrd.open_workbook(path+'\\'+filename)
# 获取所有表格名称
print(workbook.sheet_names())
# 根据表格名称获取表格内容
getsheet = workbook.sheet_by_name('上交所企业')
# 表格
index= getsheet.row_values(2)
count = -1
for s in index:
count +=1
if s=="申报企业":
firm=getsheet.col_values(count)[3:]
print(firm)
if s=="审核状态":
status=getsheet.col_values(count)[3:]
print(status)
fs=list()
ss=list()
f=re.compile('.*上海.*')
count=-1
for s in firm:
count +=1
fm=f.match(s)
if fm:
fs.append(fm.group())
ss.append(status[count])
print(fs,'\n',ss)
# 输出结果
def whitespace(num=1):
ws=''
for i in range(num):
ws +=' '
return ws
print('申报企业'+whitespace(30-len('申报企业'*2))+'审核状态')
for i in range(len(fs)):
print(fs[i]+whitespace(30-len(fs[i]*2))+ss[i],'\n')