R语言对MNIST数据集分析：探索手写数字分类

最新推荐文章于 2023-06-06 01:17:56 发布

weixin_34190136

最新推荐文章于 2023-06-06 01:17:56 发布

阅读量2.5k

点赞数

文章标签： r语言人工智能数据库

原文链接：http://www.cnblogs.com/tecdat/p/11064587.html

版权

数据科学和机器学习之间区别的定义：数据科学专注于提取洞察力，而机器学习对预测有兴趣。我还注意到这两个领域大相径庭：

我在我的工作中同时使用了机器学习和数据科学：我可能会使用堆栈溢出流量数据的模型来确定哪些用户可能正在寻找工作（机器学习），但是会构建摘要和可视化来检查为什么（数据科学）。

我想进一步探讨数据科学和机器学习如何相互补充，展示我将如何使用数据科学来解决图像分类问题。我们将使用经典的机器学习挑战：MNIST数字数据库。

面临的挑战是根据28×28的黑白图像对手写数字进行分类。MNIST经常被认为是证明神经网络有效性的首批数据集之一。

预处理

默认的MNIST数据集的格式有些不方便，但Joseph Redmon已经帮助创建了CSV格式的版本。我们可以下载它的readr包。

library(readr)

library(dplyr)

mnist_raw <- read_csv("https://pjreddie.com/media/files/mnist_train.csv", col_names = FALSE)

该数据集对于60000个训练实例中的每一个包含一行，并且对于28×28图像中的784个像素中的每一个包含一列。

我们想先探索一个子集。在第一次探索数据时，您不需要完整的训练示例，因为使用子集可以快速迭代并创建概念证明，同时节省计算时间。

最低0.47元/天解锁文章

weixin_34190136

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
R语言对MNIST数据集分析：探索手写数字分类

数据科学和机器学习之间区别的定义：数据科学专注于提取洞察力，而机器学习对预测有兴趣。我还注意到这两个领域大相径庭：我在我的工作中同时使用了机器学习和数据科学：我可能会使用堆栈溢出流量数据的模型来确定哪些用户可能正在寻找工作（机器学习），但是会构建摘要和可视化来检查为什么（数据科学）。我想进一步探讨数据科学和机器学习如何相互补充，展示我将如何使用数据科学来解决图像分类问题。我们将使用经典的机...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。