要构建SLR(手语识别),我们需要做三件事:
机器学习数据集构建机器学习模型(我们将使用CNN)应用模型平台(我们将使用OpenCV)
1)数据集
可以在此处下载手势数据集(kaggle网站的/datamunge/sign-language-mnist)。
我们的机器学习数据集包含24个(J和Z除外)American Sign Laguage字母表的许多图像。每个图像的大小为28x28像素,这意味着每个图像总共784个像素。
加载机器学习数据集
要加载数据集,请使用以下Python代码:
我们的数据集采用CSV(逗号分隔值)格式。train_X和test_X包含每个像素的值。train_Y和test_Y包含图像标签。您可以使用以下Python代码查看机器学习数据集:
数据预处理
train_X和test_X包含所有像素像素值的数组。我们从这些值创建了一个图像。我们的图像尺寸是28x28,因此我们必须将阵列分成28x28像素组。为此,我们将使用以下代码:
现在我们可以使用这个数据集来训练我们的机器学习模型了。
2)建立和训练模型
我们将使用CNN(卷积神经网络)来识别字母。我们用keras。
机器学习模型的Python实现如下: