一、问题导入
自动驾驶智能小车能够沿着道路行走,能够识别道路,这是怎么做到的呢?小车的摄像头能够拍摄“照片(图像)”,小车的“大脑”能够识别这些照片(图像),根据识别到的照片(图像)执行程序,才能控制小车做“道路识别”。
小车是怎样识别摄像头拍摄到的照片(图像)的呢?这就需要我们去训练“道路识别”的模型,这个模型能够识别图片上的物体是左弯道、右弯道还是直行道。其实这就是图像分类问题,即给定一张道路的图片,这个模型就能够识别其类型。识别图片中的物体是什么,这是一个图像分类问题。为了更方面的教学,我们先训练一个简单“手写数字识别”的模型。
我们都知道,阿拉伯数字有0-9这10个数字。我们的任务是训练一个机器学习模型,这个模型能够识别图片上的数字是阿拉伯数字中的哪一个。
训练“手写数字识别”的模型要按照机器学习的流
![]() |
程来实现,让我们一起来搭建这个模型吧。
二、知识学习
1、图像分类
图像分类解决的是“是什么?”的问题,即给定一张图片,判断图片里面包含什么类别的物体。其实就是识别图像的类别,比如图像中的物体是人、羊还是猫、狗等,这就是图像分类。识别图片中的物体是什么类别,这是一个分类任务。
2、彩色图片和黑白图片
我们想让计算机对图像进行分类,首先要知道计算机中的图像是怎样表示的。
我们在计算机中打开一张图片,将这张图片放大,就会看到,这张图片是由一个个小的格子组成的,每个格子是一个色块,我们把图片中的一个格子称为一个像素,而格子的行数和列数叫做分辨率。
计算机中的图像是由像素组成的,每个像素的颜色是怎样表示的呢?我们知道,图片有黑白和彩色