二分类数据集_机器学习项目之照片分拣02:创建照片分类数据集

本文介绍了如何使用Python从不同文件夹下的jpg图片创建二分类数据集,包括图片压缩、数据集构建及保存为csv格式,为后续照片分类模型的训练做准备。通过遍历文件夹、读取图片、压缩图像并将其转换为特征向量,最终形成特征集和目标集,并保存为csv文件。
摘要由CSDN通过智能技术生成

导读:本文为照片分拣机器学习项目系列文章的第2篇,介绍如何读取不同文件夹下、不同大小的jpg格式图片,压缩至相同大小,创建csv分类数据集,用于后续分类模型的训练

项目系列文章请查看:

机器学习项目之照片分拣01:项目概述

机器学习项目之照片分拣02:创建照片分类数据集(本文)

机器学习项目之照片分拣03:训练照片分类模型

机器学习项目之照片分拣04:预测新照片类别并分别存放

项目演示视频

要实现照片的预测和分拣,首先要构建一个打好标签的图片数据集,用来训练分类模型。本文介绍如何使用Python将收集的人物和花卉图片创建为csv格式的分类数据集。

一、基本思路

首先收集照片,将照片分类别保存在计算机硬盘上;分类别逐张读取图片,将它们压缩到相同形状;创建空的特征集和目标集列表;将压缩的每张图片展平为1行,添加到特征集的尾部,同时将图片的类标签添加到目标集的尾部;更新特征集的形状,使列数相同,行数等于所有图片数量;将特征集和目标集保存为csv数据文件。

二、收集图片

收集两种类别的图片(本项目方法可以扩充到更多类别):人物和花卉,图片为jpg格式,大小可以不同,如下图所示。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值