Step1:import xlrd 或者取terminal中: pip install xlrd == 1.2.0
一定要记得是1.2.0的版本,或者后面会报错。如果,出现报错:
xlrd.biffh.XLRDError: Excel xlsx file; not supported
就是因为xlrd的版本是2.0以上的,可以去:
进行修改版本。
(这里要吐槽一下,为什么版本升级的时候,会出现这样低级的错误,这不是倒退升级吗?)
Step2:导入数据
这里需要注意:
1. 使用的是 ’ ’ 单引号进行包裹路径
2. 路径分隔符是 \ 双斜杠
Step3:读取行列数据
sheet1 = data.sheet_by_name("Sheet1") # 按名获取该文件中的表格
print("行数:", sheet1.nrows, "列数:", sheet1.ncols)
first_row_values = sheet1.row_values(1) # 获取第2行的数据
first_col_values = sheet1.col_values(0) # 获取第1列的数据
附完整代码
import numpy as np
from datetime import datetime
import xlrd
from xlrd import xldate_as_tuple
# 读取Excel数据
def readExcelData(filePath, sheetName, startReadRow, endReadRow, startReadCol, endReadCol):
"""
param filePath: 文件路径
param sheetName: 所读取文件中的表格名字
param startReadRow: 从多少行开始阅读,注意是从0开始哟,例如:wps中的第4行,这里要换成从第3行
param endReadRow: 结束读取的行,如结束读取的行在WPS中显示 43,则这里的 endReadRow = 42
param startReadCol: 从多少行开始读取
param endReadCol: 从多少行结束读取
return: 表格中的数据,为数组类型,可以直接通过 dataArr[0,:]取行列数据
"""
workbook = xlrd.open_workbook(filePath)
sheet = workbook.sheet_by_name(sheetName) # 通过名称获取,读取第一个接收的表格
first_row_values = sheet.row_values(1) # 去读表格第一行数据,如果是字典模式可以当做key使用,列表可用户那单元格数据判断使用
dataArr = []
num = startReadRow # 从表格第几行开始读取
for row_num in range(num, endReadRow + 1): # 循环根据拿到的行数循环多少次,拿完为止
row_values = sheet.row_values(row_num) # 返回由该行中所有单元格的数据组成的列表
if row_values:
str_obj = []
for i in range(startReadCol, endReadCol+1): # 循环取单元格里的值
ctype = sheet.cell(num, i).ctype # 返回单元格对象
cell = sheet.cell_value(num, i) # 返回单元格中的数据
# todo if ctype == 2 and cell % 1 == 0.0 解决当为浮点数的时候的精度问题
if ctype == 3: # 0:null, 1字符串, 2 数字, 3 日期, 4 boolean, 5 error
date = datetime(*xldate_as_tuple(cell, 0))
cell = date.strftime('%Y/%m/%d %H:%M:%S')
elif ctype == 4:
cell = True if cell == 1 else False
str_obj.append(cell)
dataArr.append(str_obj)
num = num + 1
return np.array(dataArr)