0 这个软件是做什么的呢?
软件设计初衷
如题,这个软件的功效就是自动化的数据均分。熟悉我的朋友应该知道,我是一个深度学习方向的本科炼丹新手,经常需要对一个大的数据进行分组然后下放到科研组的学弟学妹那里进行标注。这个过程是非常无趣的而且还会浪费大量的时间。虽然说写一个脚本去分数据并不难但是随便写一个然后不知道扔到哪了下一次又遇到又要写毕竟是非常无聊的过程,并且我科研小组内并非负责编程部分的前辈们也不一定具备这样的能力。因此,我决定直接写一个成型的GUI软件,来完成这个自动化过程。
本代码所需第三方依赖:wxpython
软件实现的功能
- 对一个数据文件夹下的所有文件夹进行遍历,并将特定格式的数据全部取出并分配。
- 实现对特定组数的分配。
1 遍历部分——DFS的Python实现
上级的老师或者前辈给我们下发数据的时候通常是未经处理的,一个文件夹中又有多个分级文件夹的状况。这个其实很好理解,毕竟在进炼丹炉之前数据分类分批存储是非常自然的事情。然而,在我们分发数据的时候,这些数据很有可能是并没有本质区别的,过多的分级只会让我们的效率变低。因此,我们需要将文件夹下的所有特定格式文件全部整理出来一次性分配完成。
这个工作其实就是一个非常简单的数据结构DFS算法。我在这里用了一个非常粗糙的实现方式,即代码中的 dfsDataGetter 函数。
def dfsDataGe