近几天笔者深入学习了下机器学习、深度学习,不论是谷歌围棋AIAlphaGo、还是目前使用的阿里云智能语音合成,都非常吸引人。连续多天的理论学习后,总体而言,绝大多数教程都围绕数学算法展开,而实际上我们的需求与算法之间,对新手而言还是非常不容易去匹配的。比如当下的简单图片分类模型。
0. 简介
turicreate是苹果开源的一款人工智能工具,特点是简化了机器学习的开发模型,不必成为深度学习专家,就可以实现目标检测、图像分类、或与图像分类相似的分类。缺点是不支持windows,在wsl2里数次安装无果后,我直接写了个Docker,然后拿来就用。
turicreate的简单性,下面体验过就知道,完全是无脑操作,不需要懂背后的一堆数学模型,是一个比较通用的分类工具。之前学习过一些Pytorch的基础知识,在图像分类面前,目前还比较困难,后续我会逐步学透。
项目开源地址:apple/turicreate
1. 分类模型基本原理
需求:采集图像资源并进行人工处理,实现基本的分类操作,然后利用机器学习预测未知图像。
以连连看游戏为例,想要设计一种自动消除的机器智能,首先要做的就是机器感知出正确的图片,这样才可以输出二维矩阵,进行连连看消除算法。而图片感知这块,有一种理想状态是:截取卡片内中心点,对比RGB信息,如果一样则归为一类;但实际上由于截图不是非常精确或多点类