2016年05月_LXYTSOS

09月 05月 04月 03月

原创在Kaggle手写数字数据集上使用Spark MLlib的RandomForest进行手写数字识别

昨天我使用Spark MLlib的朴素贝叶斯进行手写数字识别，准确率在0.83左右，今天使用了RandomForest来训练模型，并进行了参数调优。首先来说说RandomForest 训练分类器时使用到的一些参数： numTrees：随机森林中树的数目。增大这个数值可以减小预测的方差，提高预测试验的准确性，训练时间会线性地随之增长。 maxDepth：随机森林中每棵树的深度。增加这个值可以是模型更具

2016-05-12 20:36:43 14585

原创在Kaggle手写数字数据集上使用Spark MLlib的朴素贝叶斯模型进行手写数字识别

昨天我在Kaggle上下载了一份用于手写数字识别的数据集，想通过最近学习到的一些方法来训练一个模型进行手写数字识别。这些数据集是从28×28像素大小的手写数字灰度图像中得来，其中训练数据第一个元素是具体的手写数字，剩下的784个元素是手写数字灰度图像每个像素的灰度值，范围为[0,255]，测试数据则没有训练数据中的第一个元素，只包含784个灰度值。现在我打算使用Spark MLlib中提供的朴素贝叶

2016-05-11 22:40:40 10546

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 在Kaggle手写数字数据集上使用Spark MLlib的RandomForest进行手写数字识别

原创 在Kaggle手写数字数据集上使用Spark MLlib的朴素贝叶斯模型进行手写数字识别

空空如也

空空如也

原创在Kaggle手写数字数据集上使用Spark MLlib的RandomForest进行手写数字识别

原创在Kaggle手写数字数据集上使用Spark MLlib的朴素贝叶斯模型进行手写数字识别