python读取excel数据

最新推荐文章于 2024-08-29 02:17:56 发布

陈壮实的搬砖日记

最新推荐文章于 2024-08-29 02:17:56 发布

阅读量5.3k

点赞数 5

分类专栏： python 文章标签： python pycharm

本文链接：https://blog.csdn.net/qq_41915623/article/details/120595388

版权

python 专栏收录该内容

14 篇文章 1 订阅

订阅专栏

Step1：import xlrd 或者取terminal中： pip install xlrd == 1.2.0

一定要记得是1.2.0的版本，或者后面会报错。如果，出现报错：

xlrd.biffh.XLRDError: Excel xlsx file; not supported

就是因为xlrd的版本是2.0以上的，可以去：
在这里插入图片描述
进行修改版本。

（这里要吐槽一下，为什么版本升级的时候，会出现这样低级的错误，这不是倒退升级吗？）

Step2：导入数据

在这里插入图片描述
这里需要注意：
1. 使用的是 ’ ’ 单引号进行包裹路径
2. 路径分隔符是 \ 双斜杠

Step3：读取行列数据

sheet1 = data.sheet_by_name("Sheet1")   # 按名获取该文件中的表格

print("行数：", sheet1.nrows, "列数：", sheet1.ncols)
first_row_values = sheet1.row_values(1) # 获取第2行的数据
first_col_values = sheet1.col_values(0) # 获取第1列的数据

附完整代码

import numpy as np
from datetime import datetime
import xlrd
from xlrd import xldate_as_tuple


# 读取Excel数据
def readExcelData(filePath, sheetName, startReadRow, endReadRow, startReadCol, endReadCol):
    """
    param filePath:         文件路径
    param sheetName:        所读取文件中的表格名字
    param startReadRow:     从多少行开始阅读，注意是从0开始哟，例如：wps中的第4行，这里要换成从第3行
    param endReadRow:       结束读取的行，如结束读取的行在WPS中显示 43,则这里的 endReadRow = 42
    param startReadCol:     从多少行开始读取
    param endReadCol:       从多少行结束读取
    return: 表格中的数据，为数组类型，可以直接通过 dataArr[0,:]取行列数据
    """
    workbook = xlrd.open_workbook(filePath)
    sheet = workbook.sheet_by_name(sheetName)               # 通过名称获取，读取第一个接收的表格
    first_row_values = sheet.row_values(1)                  # 去读表格第一行数据，如果是字典模式可以当做key使用，列表可用户那单元格数据判断使用
    dataArr = []
    num = startReadRow                                      # 从表格第几行开始读取
    for row_num in range(num, endReadRow + 1):              # 循环根据拿到的行数循环多少次，拿完为止
        row_values = sheet.row_values(row_num)              # 返回由该行中所有单元格的数据组成的列表
        if row_values:
            str_obj = []
        for i in range(startReadCol, endReadCol+1):              # 循环取单元格里的值
            ctype = sheet.cell(num, i).ctype                # 返回单元格对象
            cell = sheet.cell_value(num, i)                 # 返回单元格中的数据
            # todo if ctype == 2 and cell % 1 == 0.0 解决当为浮点数的时候的精度问题
            if ctype == 3:                                  # 0:null, 1字符串， 2 数字， 3 日期， 4 boolean, 5 error
                date = datetime(*xldate_as_tuple(cell, 0))
                cell = date.strftime('%Y/%m/%d %H:%M:%S')
            elif ctype == 4:
                cell = True if cell == 1 else False
            str_obj.append(cell)
        dataArr.append(str_obj)
        num = num + 1
    return np.array(dataArr)