百度飞浆|数据获取与处理(以CV任务为主)

本文介绍了在计算机视觉任务中如何利用百度飞浆平台获取和处理数据,包括使用labelme进行标注,讨论了数据预处理与增强技术,以及模型训练时的评估指标如Accuracy、IoU等。
摘要由CSDN通过智能技术生成

1.数据的获取途径

     通过AIStudio中的数据集功能可以获得各个比赛平台的大部分数据包括Kaggle、天池、讯飞,Github等,也有很多论文数据集可以自行搜索。   

 

2.数据处理与标注

数据在获取到后,需要了解数据,筛除不适合的样本(即便公开数据集可能也需要筛除一部分)。

如果是自建数据集需要自己进行标准,常用的标注工具有labelimg、labelme、PPOCRLabel、ITK-SNAP(医疗图像数据)、easyDL(百度研发平台,使用比较简单 EasyDL-零门槛AI开发平台 (baidu.com))。

本人使用的是labelme,首先在anaconda创建虚拟环境。

conda create -n labelme python=3.6

完成后,激活环境,安装labelme(可能需要先安装别的依赖包)

conda activate labelme

conda install labelme=3.16.2

安装成功后,只需要进入添加labelme的虚拟环境,运行命令即可使用:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值