最近在做一些数据标注的工作,虽然标注数据比较枯燥,但这也是每个做算法的工程师升级打怪的必由之路。使用一些合适的工具往往可以事半功倍,效率UP。
一:数据标注流程
![c14d1ced15f2eb996ed3ce9a24063f22.png](https://i-blog.csdnimg.cn/blog_migrate/f715d1440b29dd064b6000f354664f46.png)
二:数据处理的一些小代码
1:重命名
当得到这样格式命名不一致的数据的时候,重命名是最好的方法。
![588ee21250b117ef1e9c4b150446c976.png](https://i-blog.csdnimg.cn/blog_migrate/62bc551ed8ce36d2c4ca82cae07bf1cd.png)
代码:
#coding=UTF-8
'''
重命名工具
'''
import os
import sys
def rename():
path=input(r"请输入路径(例如D:picture):")
name=input("请输入开头名:")
startNumber=input("请输入开始数:")
fileType=input("请输入后缀名(如 .jpg、.txt等等):")
print("正在生成以"+name+startNumber+fileType+"迭代的文件名")
count=0
filelist=os.listdir(path)
for files in filelist:
Olddir=os.path.join(path,files)
if os.path.isdir(Olddir):
continue
Newdir=os.path.join(path,name+str(count+int(startNumber))+fileType)
os.rename(Olddir,Newdir)
count+=1
pri