神经网络实现猫的种类识别

神经网络实现猫的种类识别

代码地址:https://github.com/yeLer/cat_kind
在这里插入图片描述

实现的主要部分有

  • 简单的网络结构在猫的种类识别上的应用,测试准确率0.832
  • 使用resNet50在猫的种类识别上的应用,测试准确率0.866
  • 使用数据增强解决过拟合问题,并提高测试准确率,测试准确率0.999

项目文件夹说明

------
cat_kind  项目文件名
    |----cat_data_resNet50  存放用于resNet网络训练的数据
        |----train      训练数据
        |----test       测试数据
    |----cat_kind_data  存放用于简单案例网络训练的数据(train.py)
        |----train      训练数据
        |----test       测试数据
    |----dataAug    数据增强后存放训练集的位置
    |----models     保存训练模型的位置
    |----predict_imgs   测试过程中使用的图片文件夹
    |----resnet_example     使用resnet网络的文件夹
        |----predict_on_resnet.py   预测的时候使用的文件
        |----resnet50.py    定义resnet网络的文件
        |----train_on_resnet.py     训练resnet的文件
    |----source_images      数据集的原始文件夹
        |----孟买猫
        |----布偶猫
        |----暹罗猫
        |----英国短毛猫
    |----tools      工具文件夹
        |----data_aug.py    数据增强
        |----prepare_data.py    数据预处理
    |----predict.py     使用简单网络进行预测的文件
    |----requirement.txt    环境依赖
    |----train.py       使用简单网络进行训练的文件
step1 数据集预处理

使用文件:prepare_data.py

包括的操作有:

图片重命
  • 在renameJPG()方法实现,重命名的意图有两个,第一是将图片都统一为一种图片类型,
    第二个目的是给图片添加训练标签(当然也可以将标签写在文件当中,这里只是一种简便的
    做法)
图片转换为统一的格式
  • 图片重命名保存的过程中将图片统一格式
图片统一大小
  • 该网络要求输入图片的大小为(100,100),所以运行时要修改out_img_size为(100,100),数据集保存位置save_dir为cat_kind_data
将图片按照一定的比例划分
  • 按照比例9:1将数据划分为训练集和测试集,默认参数为0.9
step2 训练
step3 测试

二 使用经典网络ResNet50实现猫的种类识别

  • 由于resnet网络较为复杂,在少量的数据集情况下结果容易出现过拟合,所以首先进行数据增强的处理
step1 数据增强

在这里插入图片描述

直接运行data_aug.py,然后会在dataAug文件夹下生成四个对应猫种类的文件夹,相应的参数可以在data_aug.py调整

在这里插入图片描述

step2 数据集预处理

使用文件:prepare_data.py

包括的操作有:

图片重命名
  • 在renameJPG()方法实现,重命名的意图有两个,第一是将图片都统一为一种图片类型,
    第二个目的是给图片添加训练标签(当然也可以将标签写在文件当中,这里只是一种简便的
    做法)
图片转换为统一的格式
  • 图片重命名保存的过程中将图片统一格式
图片统一大小
  • 在resNet中要求图片的大小在197——224之间,这里将图片的大小统一在224*224
将图片按照一定的比例划分
  • 按照比例9:1将数据划分为训练集和测试集
step3 定义网络结构
  • 网络结构采用Keras搭建好的resNet50,使用文件:resnet_example/resnet50.py

  • 使用文件:resnet_example/resnet50.py,原始文件可从deep-learning-models
    获取,为了使得该文件能适应训练加测试,我做了相应的修改

step4 训练
  • 使用文件:resnet_example/train_on_resnet.py
step5 测试
  • 使用文件:resnet_example/predict_on_resnet.py
好的,让我们来搭建一个卷积神经网络实现种类识别。 首先,我们需要导入相关的库。我们将使用PyTorch来构建我们的模型,并使用torchvision加载和预处理我们的数据集。 ```python import torch import torch.nn as nn import torch.optim as optim import torchvision import torchvision.transforms as transforms ``` 接下来,我们需要定义我们的数据集和数据加载器。我们将使用ImageFolder数据集,它会自动从文件夹中读取图像,并将它们标记为不同的类别。我们还将使用transforms来对图像进行预处理,例如将它们缩放为相同的大小并进行归一化。 ```python # 定义数据集和转换 transform = transforms.Compose( [transforms.Resize((224, 224)), transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]) trainset = torchvision.datasets.ImageFolder(root='./data/train', transform=transform) trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2) testset = torchvision.datasets.ImageFolder(root='./data/test', transform=transform) testloader = torch.utils.data.DataLoader(testset, batch_size=4, shuffle=False, num_workers=2) classes = trainset.classes ``` 现在我们可以开始定义我们的模型。我们将使用一个卷积神经网络,其中包含三个卷积层和三个池化层,然后是两个全连接层。我们还将使用Dropout来减少过拟合。 ```python class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.conv1 = nn.Conv2d(3, 6, 5) self.pool = nn.MaxPool2d(2, 2) self.conv2 = nn.Conv2d(6, 16, 5) self.conv3 = nn.Conv2d(16, 32, 5) self.fc1 = nn.Linear(32 * 25 * 25, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, len(classes)) self.dropout = nn.Dropout(p=0.5) def forward(self, x): x = self.pool(nn.functional.relu(self.conv1(x))) x = self.pool(nn.functional.relu(self.conv2(x))) x = self.pool(nn.functional.relu(self.conv3(x))) x = x.view(-1, 32 * 25 * 25) x = self.dropout(nn.functional.relu(self.fc1(x))) x = self.dropout(nn.functional.relu(self.fc2(x))) x = self.fc3(x) return x net = Net() ``` 现在我们可以定义损失函数和优化器。我们将使用交叉熵损失函数和随机梯度下降优化器。 ```python criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9) ``` 最后,我们可以开始训练我们的模型。我们将对模型进行10个周期的训练,并在每个周期后进行测试。 ```python # 训练模型 for epoch in range(10): running_loss = 0.0 for i, data in enumerate(trainloader, 0): inputs, labels = data optimizer.zero_grad() outputs = net(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() if i % 2000 == 1999: print('[%d, %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 2000)) running_loss = 0.0 # 在测试集上测试模型 correct = 0 total = 0 with torch.no_grad(): for data in testloader: images, labels = data outputs = net(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print('Accuracy of the network on the test images: %d %%' % ( 100 * correct / total)) ``` 这是一个基本的卷积神经网络模型,可以用来识别的不同品种。可以根据需要对其进行改进和调整,以提高其性能。
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值