飞桨领航团AI达人创造营第二课笔记

第一课笔记


前言

今天是第二课,主要是了解数据集的获取途径以及数据处理的技巧


一、数据集获取途径

数据集可以从AIStudio,kaggle及天池等平台获取,当然,也可以自己做

图像处理流程

  1. 图片数据获取
  2. 图片数据清洗
  3. 图片数据标注
  4. 图片数据预处理
  5. 图片数据准备
  6. 图片数据增强

图像处理应该是出于项目的最终目的,检查数据是否在预定范围内,是否符合预期,如有不好的则剔除,使得数据可以更好使用,可以更好地提取特征,减少在后期可能出现的问题

二、欠拟合和过拟合

欠拟合

欠拟合很好理解,就是模型没有找到数据集的一般规律,或者说不能很好地总结数据集的特征,使得到的模型精确度不高

过拟合

过拟合,网上的解释是说能在训练数据上有很好的表现,但在测试数据上却表现一般。
对此,我的理解是,应该是在训练中,模型总结出来的一般规律偏离的人们的预期。例如,在口罩识别中,如果我输入的图片都是带着口罩的人,这些人都有一头长发,那过拟合的结果可能是模型只记住了长发,而没有记住口罩,这样,在测试的时候就可能出现光头戴口罩却识别不出来。

作业完成过程

之前没学过人工智能,一切都得从零开始
作业是要求上传图片以及对应的标注文件

首先,下载labelImg,点击课件中的超链接https://github.com/tzutalin/labelImg,下载文件,翻到下面,发现有安装方法

安装方法

下载Anaconda并安装
建立一个新的文件夹,点击安装文件,根据自己的实际情况勾选选项,将anaconda安装到新建的文件夹
然后要添加环境变量
右键 “此电脑”,找到“高级系统设置”
环境变量
然后点击用户变量中的 “Path”,添加以下环境变量:

  1. D:\anaconda
  2. D:\Python\Scripts
  3. D:\anaconda\Library\bin
    完成后保存关闭窗口

接着点击电脑左下角的可以发现
anaconda
点击上图中的第三个,也就是Prompt
还记得上面提到GitHub上的安装方法吗?
依次输入以下
conda install pyqt=5
conda install -c anaconda lxml
pyrcc5 -o libs/resources.py resources.qrc
python labelImg.py

完成后就可以进行标注
新建Annotations和JPEGImages
我在TB上找了20张键盘的图片,并把图片放到JPEGImages文件夹
点击labelImg左侧的 Open Dir ,选择到JPEGImages文件夹,再点Change Save Dir,选择到Annotations
按W可以开始标注,框选所需部分后会出现一个窗口,这里输入对应的名字,我用的图片是键盘,则输入keyboard,名字应该是可以随便起的。
标注好一张图片后点击左侧保存,再点Next Image下一张图片

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

存江

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值