循环读取某文件夹下的所有txt文件数据

最新推荐文章于 2024-04-21 08:00:00 发布

米雪唲2

最新推荐文章于 2024-04-21 08:00:00 发布

阅读量3.8k

点赞数 1

分类专栏： python 文章标签： python

@Michelle

本文链接：https://blog.csdn.net/u014150715/article/details/123878022

版权

python 专栏收录该内容

21 篇文章 2 订阅

订阅专栏

# -*- coding: utf-8 -*-
# @Software: PyCharm
# 循环读取某文件夹下的所有txt文件数据

import os
import numpy
import pandas
from xlrd import open_workbook
from xlutils.copy import copy
import time
from Datas.MatchKeyData import *

class CycleMatchKey():

    def test_file2(self,file_path):
        path = file_path  # 文件夹目录 将路径设置为变量参数：
        files = os.listdir(path)  # 得到文件夹下的所有文件名称
        txt_list = []  # 定义空列表来存储
        index = 1  # 第几个
        cmk = CycleMatchKey() # 实例化类
        for file in files:  # 遍历文件夹
            # print(file)
            # print("第",index,"app文件")
            position = path + '\\' + file  # 构造绝对路径，"\\"，其中一个'\'为转义符
            # print(position)  # 打印出文件名称路径
            with open(position, mode='r', encoding='utf-8') as f:  # 打开文件 # gb18030  #utf-8
                content = f.read()  # 读取文件
                cmk.cycle_keyword(content, file, index)
                txt_list.append(content)  # 添加到数组中
            index += 1
        #  join()：    连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串
        # txt_list = ','.join(txt_list)  # 转化为非数组类型
        # print(txt_list)  #打印出文本内容
        return content

 
if __name__ == '__main__':
    cmk=CycleMatchKey()
    cmk.test_file2(file_path5)



'''
ps:部分txt文件会报如下错误，需手动转换txt的编码格式
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte
'''

米雪唲2

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
循环读取某文件夹下的所有txt文件数据

# -*- coding: utf-8 -*-# @Software: PyCharm# 循环读取某文件夹下的所有txt文件数据import osimport numpyimport pandasfrom xlrd import open_workbookfrom xlutils.copy import copyimport timefrom Datas.MatchKeyData import *class CycleMatchKey(): def test_file2(s
复制链接

扫一扫