用GraphLab Create快速体验深度学习

最新推荐文章于 2022-09-29 21:40:54 发布

PlanckScale1729

最新推荐文章于 2022-09-29 21:40:54 发布

阅读量1.3k

点赞数 3

分类专栏：资讯文章标签：计算机视觉机器学习深度学习 GraphLab-Create ImageNet

资讯专栏收录该内容

8 篇文章 1 订阅

订阅专栏

本文原载于我的主页：planckscale.info，转载于此。

版权声明：本文系PlanckScale工作室翻译整理，欢迎转载，但转载请以超链接形式注明文章来源(planckscale.info)、作者信息和本声明，否则将追究法律责任。

消息来源： GraphLab Create关于深度学习的一篇博文

机器学习的一个核心目标是对输入数据进行分类。例如一个训练好的分类器，输入一张图片便可预测这张图中是狗还猫。

用来分类的方法有很多，支持向量机、逻辑回归、深度学习等。最近深度学习如日中天，虽然很强大，但其训练起来却是昂贵的，费时费力。你需要确定网络多少层，需要确定每层多少个节点，需要初始化模型的参数等等。简单来说，深度学习模型就像一个带有很多旋钮和表盘的机器，这些旋钮和表盘你没调好它就罢工。

最新发布的GraphLab Create 1.1 及1.2使深度学习变得超级简单。它不需要你自己在选择模型和调参上成为专家，就可以玩转神经网络。基于输入数据，neuralnet_classifier.create()函数选择一个网络架构并设置合理的参数值。在MNIST上测试：

在测试集上评估这个模型：

结果达到了98%的精度。寥寥几行代码，深度学习就这么简单。

这样还不够，GraphLab Create还要求要使深度学习变得更简单。尽管GraphLab Create能选择较好的网络架构和参数，但这种自动化处理往往是不够的。优化设置往往是极端具体的问题，没有好的直觉、没有足够丰富的经验、没有很多PhD学生的话这个问题很难解决。

其实并非所有问题都得从头开始去训练一个深度模型，再者说，你要解决的问题也并不特殊，它与一些已经解决的问题多少有关联。拿分类猫狗的例子，最有名的数据集ImageNet，DNN表现最优异，其训练的模型可将输入从一千种类别中分辨出其属于哪一类。分辨狮子和狐狸类别的那些特征难道对分辨猫狗没用?

当然有用。通过简单移除DNN的输出层，将传播到输出层的信号作为特征喂给任何一种分类器便可解决我们区分猫狗的任务。步骤如下：

第一步：在一个超大的通用的数据集上训练一个DNN分类器。最好的例子是ImageNet,1000种类别120万张图片。GraphLab拥有在ImageNet上训练好的模型，因此当你应用的时候可以跳过这一步，只需下载这个模型：

gl.load_model(‘http://s3.amazonaws.com/GraphLab-Datasets/deeplearning/imagenet_model_iter45′)

第二步：DNN每一层的输出可以看作每张图像的一个有意义的向量表示。对你任务中的图像，提取输出层前面那层的特征向量。

第三步：以这些特征作为输入，训练一个针对你自己任务的新的分类器。

乍一看可能觉得这样比训练一个DNN更复杂。其实不然，第一步可在很多不同的问题上复用，而且GraphLab给你提供了这个模型，所以并不需要你自己去训练。第二步用GraphLab的API就可搞定。第三步随便一个比深度学习模型简单的分类器都可行。这样一套流程下来，无需调参、训练更快、效果更好，即使有时训练数据不够也不影响。另外，即便你的第三步分类任务与第一步训练的任务相对无关，此方法效果依然很好。