基于tensorflow猫狗识别————数据处理（1）

最新推荐文章于 2024-07-30 17:23:09 发布

gagaki

最新推荐文章于 2024-07-30 17:23:09 发布

阅读量1.4k

点赞数 1

分类专栏： tensorflow笔记文章标签： python 机器学习 tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gagaki/article/details/106139090

版权

文章目录

一、数据集下载

kaggle官网上提供猫狗识别数据集的下载，但是要翻墙，这里提供网盘保存。

链接：https://pan.baidu.com/s/1-0eBeAyE5i4TMiNS8CQcVQ
提取码：31sc
训练数据包含猫和狗各12500张图片，测试数据包含12500张猫和狗的图片。

二、打标签

代码的逻辑如下：

给数据集打标签，猫为0，狗为1。
首先通过*listdir（path)*获取该路径下图片名称，
再通过*split*切分名称，
判断切分出来的第一个元素是cat还是dog，
如果是cat，就组合路径和file,得到一个完整的图片路径，获取图片，用*append*函数将0加到label中
如果是dog,组合路径和file,得到一个完整的图片路径，获取图片，用*append*函数将1加到label中
为了提高训练模型的精度，要把数据集顺序打乱。
用*hstack*将cats,dogs水平拼接，放到image_list，label_cats和dog_cats拼接,放到label_list
数据集中有12500张猫，12500张狗，拼接后的image_list和label_list长度都为25000
存到temp中，此时temp的形状为2x25000，对temp转置后形状为25000x2，shuffle后打乱image_list和label_list
为什么要转置后才shuffle？
因为转置之前只有两行，shuffle只是把image_list和label_list的上下顺序颠倒，对图片和标签来说么有变化
转置后把图片和标签一一对应生成25000行的数组，再shuffle就可以将这25000行的顺序打乱。第一列是image_list,第二列是label_list
例如：

a=[1,2,3,4,5]
b=[2,1,3,5,3]
c=np.array([a,b])
c=np.transpose(c)
np.random.shuffle(c)
输出：
c=[[4 5]
 [5 3]
 [2 1]
 [1 2]
 [3 3]]

具体实现代码如下：

import os
import numpy as np

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
基于tensorflow猫狗识别————数据处理（1）

文章目录**一、数据集下载**二、图片裁剪**三、打标签**一、数据集下载ggle官网上提供猫狗识别数据集的下载，但是要翻墙，这里提供网盘保存。链接：https://pan.baidu.com/s/1-0eBeAyE5i4TMiNS8CQcVQ提取码：31sc训练数据包含猫和狗各12500张图片，测试数据包含12500张猫和狗的图片。**二、图片裁剪**在用AlexNet神经网络模型训练之前要将图片统一裁剪成227x227大小，用opencv来裁剪。import cv2import o
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。