获取两级目录下的文件
在神经网络的学习中,经常会读取数据集来进行训练。通常我们都是把数据集放到一个目录下,那么对于存在两级目录的文件该如何读取呢?
对于一些算法,把目录的名称作为类别的名字,而目录下的文件是一个类别的文件,显然,只对一个类别进行训练意义不大。因此获取两级目录下的文件对该算法 就行之有效。
下面为可运行代码:
# 定义一个大的文件路径,其中包含有n个子目录,每个子目录下包含m个文件
# 现在求得每个子目录下面的文件的路径,并存放到列表里
# path 为原始目录的路径
# new_path 为一个列表。包含了path下所有子目录里的所有文件
# classes 为子目录的个数(也叫做类别)
# label 为每个子目录的名字
import os
path = './data'
new_path = [