机器学习
twilight_cc
这个作者很懒,什么都没留下…
展开
-
PCA之sklearn与sparkmllib源码剖析对比
最近在进行sparkmllib的PCA计算结果验证的时候,发现与相同数据集在sklearn下PCA计算的结果相差很大。首先想到了数据的标准化操作,怀疑sklearn有默认参数设置为对输入数据进行标准化处理,接下来进sklearn官网查看PCA参数设置class sklearn.decomposition.PCA(n_components=None, copy=True, whiten=False...原创 2019-12-11 14:09:58 · 814 阅读 · 1 评论 -
决策树
决策树决策树ID3算法C4.5CART算法连续属性离散化过拟合问题决策树辅助决策的树状知识结构,通过将样本分配到某叶子节点来确定样本所属的类别,由决策节点,分支和叶节点组成,目标:使支持分类的属性越少越好,即用很少的属性就能区分出样本类别。首先选取的一些属性就能区分出大部分样本,少量样本需要扩增属性进一步划分算法通常包括三个步骤:特征选择,决策树的生成,决策树的修剪决策树可表示给定特征下类...原创 2019-12-04 13:54:48 · 190 阅读 · 0 评论 -
贝叶斯优化与高斯过程
概述贝叶斯优化框架,高斯过程原创 2019-10-24 14:34:08 · 2553 阅读 · 1 评论 -
机器学习01-基础概念公式
最大似然估计似然函数是一种关于统计模型中的参数的函数,表示模型参数的似然性。似然函数取得最大值表示相应的参数能使统计模型最为合理。L(b∣A)=P(A∣B=b)L(b|A)=P(A|B=b)L(b∣A)=P(A∣B=b)假设空间由输入空间到输出空间的所有模型映射的集合损失函数模型输出的预测值f(X)f(X)f(X)与真实值YYY的非负实值函数风险函数(期望损失)模型f(X)f(X...原创 2019-10-15 12:05:38 · 146 阅读 · 0 评论 -
机器学习03-模型评估
分类模型:混淆矩阵,ROC,KS,LIFT,GAIN,回归模型:MAE,MSE,RMSE原创 2019-10-08 10:55:11 · 224 阅读 · 0 评论 -
机器学习05-电子推荐系统
推荐系统通用模型介绍原创 2019-10-08 10:56:58 · 447 阅读 · 0 评论 -
机器学习02-分类算法
介绍机器学习主要分类算法:决策树、支持向量机、贝叶斯、集成学习等原创 2019-10-08 14:32:52 · 371 阅读 · 0 评论 -
机器学习04-神经网络基础
介绍深度学习中神经网络的基础知识原创 2019-10-08 16:49:26 · 321 阅读 · 0 评论