遍历文件夹下所有excel,并转换为csv

__author__ = "xiaoyan.qin"

#from excel import walkFile, DFS_file_search

'''
Excel文件转csv文件脚本
支持文件夹嵌套
支持xlsx 和 xls 格式
在同级目录下生成对应sheet名称 的文件,采用UTF-8编码
'''
import xlrd
import csv
import os
import sys


# 生成的csv文件名
def DFS_file_search(dict_name):
    import os
    # list.pop() list.append()这两个方法就可以实现栈维护功能
    stack = []
    result_txt = []
    print(dict_name)
    stack.append(dict_name)
    while len(stack) != 0:  # 栈空代表所有目录均已完成访问
        temp_name = stack.pop()
        try:
            temp_name2 = os.listdir(temp_name) # list ["","",...]
            print(temp_name2)
            for eve in temp_name2:
                stack.append(temp_name + "\\" + eve)  # 维持绝对路径的表达
        except NotADirectoryError:
            result_txt.append(temp_name)
    return result_txt
# csv_file_name = 'D:\\excel\\1.csv'
def get_excel_list():
    # 获取Excel文件列表
    excel_file_list = []
    # os.chdir("D:\excel")

    os.chdir(path=sys.argv[1])
    file_list = []

    file_list2 = DFS_file_search(os.getcwd())
    for r in file_list2:
        file_list.append(r)

    for file_name in file_list:
        if file_name.endswith('xlsx') or file_name.endswith('xls'):
            excel_file_list.append(file_name)

    return excel_file_list


def get_excel_header(excel_name_for_header):
    # 获取表头,并将表头全部变为小写
    workbook = xlrd.open_workbook(excel_name_for_header)
    table = workbook.sheet_by_index(0)
    # row_value = table.row_values(0)
    row_value = [i.lower() for i in table.row_values(0)]
    return row_value


def read_excel(excel_name):
    # 读取Excel文件每一行内容到一个列表中
    workbook = xlrd.open_workbook(excel_name)

    # 读取第一个sheet
    sheets = workbook.sheet_names()

    num = workbook.nsheets

    for i in range(num):
        sheetname = workbook.sheets()[i]

        nrows = sheetname.nrows
        ncols = sheetname.ncols
        # 跳过表头,从第一行数据开始读
        for rows_read in range(0, nrows):
            # 每行的所有单元格内容组成一个列表
            row_value = []
            for cols_read in range(ncols):
                # 获取单元格数据类型
                ctype = sheetname.cell(rows_read, cols_read).ctype
                # 获取单元格数据
                nu_str = sheetname.cell(rows_read, cols_read).value
                # 判断返回类型
                # 0 empty,1 string, 2 number(都是浮点), 3 date, 4 boolean, 5 error
                # 是2(浮点数)的要改为int
                if ctype == 2:
                    nu_str = int(nu_str)
                row_value.append(nu_str)
            yield row_value, sheetname.name  #返回sheet表格及sheet名称


def xlsx_to_csv(csv_file_name, row_value):
    # 生成csv文件
    with open(csv_file_name, 'a', encoding='utf-8', newline='') as f:  # newline=''不加会多空行
        write = csv.writer(f)
        write.writerow(row_value)


# def read_sheet_name(excel_name):
#     workbook = xlrd.open_workbook(excel_name)
#     # 读取第一个sheet
#     num = workbook.nsheets
#     for i in range(num):
#         sheets = workbook.sheets()[i]
#         print("sheetname " + sheets.name)
#         yield sheets.name


if __name__ == '__main__':
    # dirnam = sys.argv[2]
    # csv_file_name = dirnam + sys.argv[3]
    # print(csv_file_name)

    # 获取Excel列表
    excel_list = get_excel_list()
    print("excle", excel_list)
    # 获取Excel表头并生成csv文件标题
    #xlsx_to_csv(csv_file_name, get_excel_header(excel_list[0]))
    # 生成csv数据内容

    for excel_name in excel_list:
        for (row_value, sheetname) in read_excel(excel_name):
            xlsx_to_csv(sheetname, row_value)
    print('Excel文件转csv文件结束 ')

 

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,这是一个技术问题,我可以回答。您可以通过以下Python代码来实现将Azure Storage账户中指定容器内的指定文件夹中的Excel文件转换CSV文件: ```python import os from azure.storage.blob import BlobServiceClient # 连接Azure Storage账户 connect_str = "DefaultEndpointsProtocol=https;AccountName=<account_name>;AccountKey=<account_key>;EndpointSuffix=core.windows.net" blob_service_client = BlobServiceClient.from_connection_string(connect_str) # 指定容器和文件夹 container_name = "<container_name>" folder_name = "<folder_name>" # 遍历指定文件夹中的Excel文件并转换CSV container_client = blob_service_client.get_container_client(container_name) blobs = container_client.list_blobs(name_starts_with=folder_name) for blob in blobs: if blob.name.endswith('.xlsx'): blob_client = blob_service_client.get_blob_client(container=container_name, blob=blob.name) excel_data = blob_client.download_blob().readall() csv_data = excel_data.decode('utf-8-sig') # 用带BOM的UTF-8编码读取Excel文件 csv_name = blob.name[:-5] + '.csv' csv_client = blob_service_client.get_blob_client(container=container_name, blob=csv_name) csv_client.upload_blob(csv_data, blob_type="BlockBlob") ``` 请注意,您需要将代码中的`<account_name>`和`<account_key>`替换为您的Azure Storage账户的名称和密钥,以及将`<container_name>`和`<folder_name>`替换为您要操作的容器和文件夹的名称。此外,您还需要使用Azure Storage Blob Python SDK,可以使用以下命令安装: ``` pip install azure-storage-blob ``` 希望这可以帮助您完成您的任务!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值