python读取高校基本信息.xls
python读取excle文件,文件后缀不同使用库不同,若文件后缀为xlsx则需要openpyxl。
本次excle为网页爬取的高校基本信息数据库,文件后缀为,xls,使用库为xlrd读excle数据到控制台,若需要写操作可以添加xlwt库,具体可参考官方api:https://pypi.org/project/xlrd/
excle数据
我直接写了一个工具类,需要使用时可直接调用。
将xls.py导入同级目录,最后导入包即可
import xlrd
class MyList:
def getList(file_name):
# 创建excle对象
wb = xlrd.open_workbook(file_name)
# 获取sheet
table = wb.sheets()[0]
# 遍历表
lists = []
# 外层遍历行内层遍历单元格
for row in range(0,table.nrows):
list = []
for cell in range(0,table.ncols):
value = table.cell_value(row,cell)
ctype = table.cell(row,cell).ctype
# 爬取int数据存在转换为小数问题,需要将小数进行强转
if ctype == 2 and cell % 1 == 0.0: # ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
value = int(value) # 浮点转成整型
# 将行数据加入list表
list.append(value)
# 将所有行加入lists表
if (str(list[2]).isdigit()):
lists.append(list)
#测试数据
# for row in list:
# print(row)
return lists
函数getList(file_name)
传入一个excle地址,将返回list列表
以下是测试类
from excle.xls import MyList
list=[]
file_name = "school.xls"
list = MyList.getList(file_name)
for row in list:
print(row)
测试结果
下一篇应该是导入到数据库