# -*- coding: utf-8 -*-
# @Software: PyCharm
# 循环读取某文件夹下的所有txt文件数据
import os
import numpy
import pandas
from xlrd import open_workbook
from xlutils.copy import copy
import time
from Datas.MatchKeyData import *
class CycleMatchKey():
def test_file2(self,file_path):
path = file_path # 文件夹目录 将路径设置为变量参数:
files = os.listdir(path) # 得到文件夹下的所有文件名称
txt_list = [] # 定义空列表来存储
index = 1 # 第几个
cmk = CycleMatchKey() # 实例化类
for file in files: # 遍历文件夹
# print(file)
# print("第",index,"app文件")
position = path + '\\' + file # 构造绝对路径,"\\",其中一个'\'为转义符
# print(position) # 打印出文件名称路径
with open(position, mode='r', encoding='utf-8') as f: # 打开文件 # gb18030 #utf-8
content = f.read() # 读取文件
cmk.cycle_keyword(content, file, index)
txt_list.append(content) # 添加到数组中
index += 1
# join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串
# txt_list = ','.join(txt_list) # 转化为非数组类型
# print(txt_list) #打印出文本内容
return content
if __name__ == '__main__':
cmk=CycleMatchKey()
cmk.test_file2(file_path5)
'''
ps:部分txt文件会报如下错误,需手动转换txt的编码格式
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte
'''
循环读取某文件夹下的所有txt文件数据
最新推荐文章于 2024-04-21 08:00:00 发布