python读取xlsx内容,提取其中的3个字段保存到.csv中,并显示保存进度

import pandas as pd
from tqdm import tqdm

# 读取xlsx文件
df = pd.read_excel('input.xlsx')

# 提取需要的字段
df = df[['字段1', '字段2', '字段3']]

# 设置保存进度条
tqdm.pandas()

# 重新排列列的顺序
df = df[['字段1', '字段2', '字段3']]

# 保存csv文件
with tqdm(total=len(df)) as pbar:
    def save_row(row):
        row.to_csv('output.csv', mode='a', header=False, index=False)
        pbar.update(1)

    df.apply(save_row, axis=1)

参考资源链接:[Python脚本快速转换xls/xlsxcsv](https://wenku.csdn.net/doc/645ca4fa59284630339a3dc9?utm_source=wenku_answer2doc_content) 在处理Excel文件到CSV的转换时,一个重要的方面是确保各种数据类型得到正确处理,并尽可能保留原始文件的格式。Python提供了多种库来实现这一功能,比如`xlrd`、`xlwt`和`openpyxl`。根据辅助资料《Python脚本快速转换xls/xlsxcsv》,我们可以采用以下两种方法: 首先,使用`xlrd`和`xlwt`库进行转换。`xlrd`能够读取xls文件并获取工作表的单元格值,而`xlwt`可以将这些值写入csv文件。在转换过程,需要特别注意数据类型的转换,比如将日期格式的单元格转换为`YYYY-MM-DD`格式的字符串,处理数字和浮点数,以及确保文本格式的一致性。 其次,使用`openpyxl`库也可以实现类似的功能,它支持xlsx格式,并且与`csv`库结合可以生成CSV文件。`openpyxl`允许更细致地处理单元格内容,例如保留单元格的格式和样式。此外,它还能够读取复杂的Excel特性,如公式和图表,并在转换过程保留这些特性。 在编写转换脚本时,应当注意以下几点: 1. 确定源文件的格式(xls或xlsx),并选择合适的库进行读取。 2. 读取文件时,遍历工作表的每个单元格,并根据单元格的数据类型进行适当的转换。 3. 将处理后的数据写入CSV文件时,使用适当的分隔符(通常是逗号),并确保正确处理字段内的特殊字符。 4. 如果使用`openpyxl`,可以利用其API来处理文件的特定格式和样式。 例如,一个简单的使用`xlrd`和`xlwt`的脚本可能包含以下步骤: - 使用`xlrd`打开xls文件,获取工作表和单元格数据。 - 遍历工作表的所有行和列,将单元格的值转换为字符串。 - 使用`xlwt`创建一个新文件,并将转换后的数据写入。 - 确保数据类型被正确处理,如日期格式化、数字格式化等。 对于`openpyxl`,步骤类似,但是需要使用`openpyxl`来读取和写入数据。 完成脚本编写后,你可以通过命令行运行它,如: ```bash python convert_xls_to_csv.py input.xls ``` 或者对于xlsx文件: ```bash python convert_xlsx_to_csv.py input.xlsx ``` 根据你的具体需求,选择合适的库和方法来实现文件格式的转换。如果需要深入理解这些库的功能和使用方法,建议阅读《Python脚本快速转换xls/xlsxcsv的相关章节,以获得更全面的指导。 参考资源链接:[Python脚本快速转换xls/xlsxcsv](https://wenku.csdn.net/doc/645ca4fa59284630339a3dc9?utm_source=wenku_answer2doc_content)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值