机器学习
nalanyu2000
这个作者很懒,什么都没留下…
展开
-
欢迎使用CSDN-markdown编辑器
Monte Carlo Tree Search 围棋的空间太大,很难用树形结构全部罗列展开,比如MinMax,所以用Monte Carlo Tree Search 对某个节点之后的情况进行随机模拟 Multi-Armed Bandit Problem这个是著名的老虎机问题xi代表玩第i台老虎机平均赢到的钱,后面根式里的表达式让算法有机会去尝试其他机器。如果一直玩同一台机器的话,n和ni都都会变大原创 2017-08-03 20:30:13 · 139 阅读 · 0 评论 -
评估指标
Accuracy Confusion Matrix 查全率recall和查准率precision通过上面表格,我们来看下查全率和查准率的定义。查全率是在这个人是Hugo Chavez的概率下,准确识别Hugo Chavez的概率(看横向)。查准率是我们检测到Hugo Chavez的次数里,确实是Hugo Chavez的概率(看纵向)。 计算Donald Rumsfeld的TP FP FN原创 2017-09-04 21:10:28 · 511 阅读 · 0 评论 -
误差原因
现在来关注一下模型起初为何会出现误差。在模型预测中,模型可能出现的误差来自两个主要来源,即:因模型无法表示基本数据的复杂度而造成的偏差(bias),或者因模型对训练它所用的有限数据过度敏感而造成的方差(variance)。偏差造成的误差 - 准确率和欠拟合如前所述,如果模型具有足够的数据,但因不够复杂而无法捕捉基本关系,则会出现偏差。这样一来,模型一直会系统地错误表示数据,从而导致准确率降低。这种现原创 2017-09-04 21:42:45 · 1302 阅读 · 0 评论 -
学习曲线
让我们根据模型通过可视化图形从数据中学习的能力来探讨偏差与方差之间的关系。机器学习中的学习曲线是一种可视化图形,能根据一系列训练实例中的训练和测试数据比较模型的指标性能。在查看数据与误差之间的关系时,我们通常会看到,随着训练点数量的增加,误差会趋于下降。由于我们尝试构建从经验中学习的模型,因此这很有意义。我们将训练集和测试集分隔开,以便更好地了解能否将模型泛化到未见过的数据而不是拟合到刚见过的数据。原创 2017-09-05 13:32:54 · 1094 阅读 · 0 评论 -
朴素贝叶斯分类器
NN原创 2017-08-24 19:54:28 · 303 阅读 · 0 评论 -
GridSearchCV
GridSearchCV 用于系统地遍历多种参数组合,通过交叉验证确定最佳效果参数。它的好处是,只需增加几行代码,就能遍历多种组合。下面是来自 sklearn 文档 的一个示例:parameters = {'kernel':('linear', 'rbf'), 'C':[1, 10]}svr = svm.SVC()clf = grid_search.GridSearchCV(svr, param原创 2017-10-27 22:36:51 · 1756 阅读 · 0 评论