代码理解:
- glob.glob是一个用于查找文件路径模式的函数。它接受一个字符串参数,该参数可以包含通配符字符(例如*和?),用于匹配文件名或路径中的特定部分。函数返回一个包含与模式匹配的文件路径的列表。
train_path = glob.glob('./mydata/train/*')
-
os.listdir和glob.glob的区别
两者都是用于获取文件和文件夹的列表,但它们之间有一些区别:-
参数类型:os.listdir接受一个目录路径作为参数,而glob.glob接受一个模式字符串作为参数。
path = 'AI量化模型预测挑战赛公开数据/train' # path路径下含有20个excel文件 train_files = os.listdir(path)
-
返回结果:os.listdir返回一个包含目录下所有文件和文件夹名称的列表,而glob.glob返回一个符合指定模式的文件路径列表。
-
文件过滤:os.listdir返回目录下所有的文件和文件夹,无法直接对文件进行过滤。而glob.glob可以使用模式字符串来匹配文件路径,从而对文件进行过滤。
-
模式匹配:os.listdir返回的是文件和文件夹的名称列表,不进行模式匹配。而glob.glob可以使用通配符和正则表达式来进行模式匹配,从而获取符合条件的文件路径。
总的来说,os.listdir更适合简单地获取目录下的文件和文件夹列表,而glob.glob更适合根据模式匹配来获取符合条件的文件路径列表。
-
- 中的元素,使其按照升序(从小到大)排列。如果列表中的元素是字符串,则按照字母顺序进行排序。如果列表中的元素是数字,则按照数字的大小进行排序。原始列表会被修改,而不是返回一个新的排序后的列表。
train_path.sort()
- 的负担
知识点
torch是一个开源的机器学习库,它提供了丰富的工具和函数,用于构建和训练神经网络。torch的核心是张量(tensor),它是一种类似于多维数组的数据结构,可以在CPU或GPU上进行计算。torch提供了各种各样的张量操作函数,如加法、乘法、矩阵乘法等,以及各种常见的数学函数和激活函数。此外,torch还提供了用于定义和训练神经网络的高级模块,如卷积层、线性层、池化层等。torch还具有自动求导功能,可以自动计算张量上的梯度,从而简化了神经网络的训练过程。torch还支持分布式计算和并行计算,可以在多个设备或多个机器上进行并行计算。总之,torch是一个功能强大的机器学习库,被广泛应用于各种深度学习任务中。