---恢复内容开始---
最近同事在处理文件导入的时候需要把一批文件换成CSV的格式,但是直觉修改后缀是不生效的,而且xlsx和xls的文件没法直接换成CVS的文件,所以找了一下方式,并且自己实现了python的转换方式。代码如下
文件需要导入pandas 还要引入xlrd
代码是基于python3.6的环境。
import pandas as pd
import os
# 读取一个目录里面的所有文件:
def read_path(path):
dirs = os.listdir(path)
return dirs
def getpath(dir):
# pwd = os.getcwd()
# father_path=os.path.abspath(os.path.dirname(pwd)+os.path.sep+".")
file_path = '/Users/XXXX/Desktop'#桌面路径地址,地址可以根据自己需要修改
full_path=file_path+'/'+dir+'/'
return full_path
#数据源Excel如果有多个sheet,那么则需要一一遍历输出
def xlsdata_to_csv(xlsx_data,tag_path):
for K, V in xlsx_data.items():
tag_file = tag_path + K + '.csv'
if not V.empty:
V.to_csv(tag_file, encoding='utf_8_sig')
def main():
source_path = getpath('test2')#存放excel文件
tag_path = getpath('test3')#输出csv的文件
dir = read_path(source_path)
for i in dir :
source_file = source_path+i
xlsx_data = pd.read_excel(source_file, sheet_name=None)
csv_path = tag_path+i.split('.')[0]#因为文件包含两个.所以分割时候做了特殊处理
xlsdata_to_csv(xlsx_data,csv_path)
if __name__ == '__main__':
main()
---恢复内容结束---
最近同事在处理文件导入的时候需要把一批文件换成CSV的格式,但是直觉修改后缀是不生效的,而且xlsx和xls的文件没法直接换成CVS的文件,所以找了一下方式,并且自己实现了python的转换方式。代码如下
文件需要导入pandas 还要引入xlrd
代码是基于python3.6的环境。
import pandas as pd
import os
# 读取一个目录里面的所有文件:
def read_path(path):
dirs = os.listdir(path)
return dirs
def getpath(dir):
# pwd = os.getcwd()
# father_path=os.path.abspath(os.path.dirname(pwd)+os.path.sep+".")
file_path = '/Users/XXXX/Desktop'#桌面路径地址,地址可以根据自己需要修改
full_path=file_path+'/'+dir+'/'
return full_path
#数据源Excel如果有多个sheet,那么则需要一一遍历输出
def xlsdata_to_csv(xlsx_data,tag_path):
for K, V in xlsx_data.items():
tag_file = tag_path + K + '.csv'
if not V.empty:
V.to_csv(tag_file, encoding='utf_8_sig')
def main():
source_path = getpath('test2')#存放excel文件
tag_path = getpath('test3')#输出csv的文件
dir = read_path(source_path)
for i in dir :
source_file = source_path+i
xlsx_data = pd.read_excel(source_file, sheet_name=None)
csv_path = tag_path+i.split('.x')[0]#因为文件包含两个.所以分割时候做了特殊处理
xlsdata_to_csv(xlsx_data,csv_path)
if __name__ == '__main__':
main()