文章目录
刚学习 python ,想试试 excel 导入文本,就查询了资料,写了个脚本;
具体功能是实现将一个目录下的所有文本导入同一个 excel ,每个文本对应各自独立的 sheet 页。
我的操作环境是 Linux,但和 Windows 大体一致。
1. 需要用到的模块
>>>import os
>>>import xlwt
- os 模块提供了非常丰富的方法用来处理文件和目录,属于默认模块无需下载。
- xlwt、xlrd 分别是对 excel 表格进行写和读的模块,但这两个模块不能处理 xlsx ;本例仅用到 xlwt 模块。
如果需要处理 xlsx 文件,则需要用到 openpyxl 模块,而且 openpyxl 可以进行读和写的操作;只是处理时间上稍慢于 xlwt 和 xlrd。(但是随着硬件水平提高,时间将越来越小)
2. 遍历文件夹
首先需要遍历整个文件夹,读取所有文本。其中 filepath 和 xlspath 分别为文件夹路径,以及 xls 的文件路径。
def getline(filepath, xlspath):
# 读取所有文本
file_names = os.listdir(filepath)
# 对os.listdir进行排序 指定参数加上 (key=lambda x:int(x))
file_names.sort()
file_ob_list = []
try:
# 获取完整目录名并保存到数组
for file_name in file_names:
file_ob = filepath + "/" + file_name
file_ob_list.append(file_ob)
print(file_ob_list) #测试输出所有的数组
2.1 读取文件并排序
这里需要用到 os.listdir(path)
,它的作用是返回path指定的文件夹包含的文件或文件夹的名字的列表。
>>> import os
>>> file_names = os.listdir('.')
>>> print(file_names)
['3.txt', '9.txt', '10.txt', '2.txt', '1.txt', '20.txt']
- 但是我发现 os.listdir() 处理后是一个乱序数组,需要进行排序,如果需要指定特定符号排序,可以用
(key=lambda x:int(x))
,详细可以百度一下。
>>> file_names.sort()
>>> print(file_names)
['1.txt', '10.txt', '2.txt', '20.txt', '3.txt', '9.txt']
#倒着数第四位'.'为分界线,按照‘.’左边的数字从小到大排序