python使用flask接受excel、txt文件,读取文件中的内容

文章介绍了在Flask应用中如何接收并处理文件上传,特别是.xlsx和.xls类型的Excel文件。通过request.files获取文件对象后,使用openpyxl处理.xlsx文件,而.xls文件则需先转换为字节流再用xlrd读取。代码示例展示了不同类型的Excel文件内容读取的方法。
摘要由CSDN通过智能技术生成

浅做一个踩坑记录,先说以下需求:flask传入文件对象,文件类型包含.xlx.xlsx.csv.txt,我现在需要获得文件的内容。

首先是flask部分代码

from flask import Flask, request, jsonify, Response
from flask_restful import reqparse, abort, Api, Resource

app = Flask(__name__)
api = Api(app)

@app.route('/example', methods=["post"])
def predict_result():
    dim = request.form.get('dim')
    upload_path = request.files['path']  # 上传的文件
    # data_path = upload_path.filename  # 文件的路径
    output = predict_main(upload_path, dim=int(dim))
    return jsonify(output)

上面是一个随便写的示例,通过upload_path = request.files['path'] 已经得到了文件对象,那么现在怎么读取文件对象里面的内容呢?这里踩了大坑了!
针对不同的数据类型,在这里要进行的处理不一致。

1 .xlsx 类型

 elif file_name.split('.')[1] == 'xlsx':
        print("xlsx", type(path))  # class 'werkzeug.datastructures.FileStorage'
        data_excel = openpyxl.load_workbook(path)  # 这里可以直接读文件对象
        data_sheet = data_excel[data_excel.sheetnames[0]]  # TODO 这是是读取第一个sheet的数据
        maxRows = data_sheet.max_row  # 行数
        maxColumns = data_sheet.max_column  # 列数
        column_list = []

        for i in range(3, maxRows + 1):  # TODO 在这里不读取前面两行的str,只读取后面的数据
            for j in range(1, maxColumns + 1):
                column_list.append(data_sheet.cell(i, j).value)
        data = np.asarray(column_list).reshape(maxRows-2, maxColumns).astype(float)   # TODO 在这里读入的是列表,所以需要重新将形状reshape回去
        return data

查看一下传入的数据类型xlsx <class 'werkzeug.datastructures.FileStorage'>,在这里openpyxl.load_workbook(path) 可以直接读取文件对象。这就非常友好!【请注意for循环里面的参数,自己做更改】
在这里插入图片描述

2 .xls 类型

同样是excel 的文件,与.xlsx的读取有差异,在这里需要先转为byte。

 elif file_name.split('.')[1] == 'xls':
        print("xls", type(path))  # class 'werkzeug.datastructures.FileStorage'
        file_content = path.read()  # 这里读二进制的文件数据
         print("xls_content", type(file_content))
        data_excel = xlrd.open_workbook(file_contents=file_content)
        data_sheet = data_excel.sheets()[0]
        # table = data_excel.sheet_by_name(sheet_name='***')  # 使用名称获取

        maxRows = data_sheet.nrows  # 行数 252
        maxColumns = data_sheet.ncols  # 列数 12
        column_list = []

        for i in range(2, maxRows):  # TODO 在这里不读取前面两行的str,只读取后面的数据
            for j in range(0, maxColumns):
                column_list.append(data_sheet.cell_value(rowx=i, colx=j))
        data = np.asarray(column_list).reshape(maxRows-2, maxColumns).astype(float)
        print(file_name, data)
        return data

在这里插入图片描述

xlrd.open_workbook(file_contents=file_content)

然后就可以直接读取里面的内容了。 后面再补充…昨天加班到凌晨五点,今天下午又加班,顶不住了。。。

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值