机器学习
喜欢吃冰棍de谷利文君
日拱一卒,功不唐捐
展开
-
机器学习——决策树
决策树圣诞节总结一下决策树的知识点 > > > > > >决策树有两个问题:1)每个节点在哪个维度做划分?2)某个维度在哪个值上做划分?1 节点字段选择的衡量标准1.1 信息熵熵在信息论中代表,随机变量不确定度的度量。 熵越大,数据的不确定性越高; 熵越小,数据的不确定性越低。熵计算公式:H=−∑i=1kpilog(pi)...原创 2019-12-25 21:58:10 · 194 阅读 · 0 评论 -
理解SVM的三层境界
支持向量机通俗导论(理解SVM的三层境界) ...转载 2019-09-08 14:42:06 · 200 阅读 · 0 评论 -
机器学习——线性回归
13 线性回归 线性回归——一种有监督的学习算法,即在建模过程中必须同时具备自变量x和因变量y。更为概括地说,线性模型就是对输入特征加权求和,再加上一个我们称为偏置项的常数。 两种不同的训练模型的方法:通过“闭式”方程——直接计算出最适合训练集的模型参数(也就是使训练集上的成本函数最小化的模型参数)。使用迭代优化的方法,即梯度下降法(GD)。逐渐调整模型参数直至训练集上的成本函数...原创 2019-09-13 14:20:29 · 665 阅读 · 0 评论 -
机器学习——降维
15 降维15.1 为什么需要降维? (1)多余的特征会影响或误导学习器 (2)更多特征意味着更多参数需要调整,过拟合风险也越大 (3)数据的维度可能只是虚高,真实维度可能比较小 (4)维度越少意味着训练越快,更多东西可以尝试,能够得到更好的结果 (5)如果我们想要可视化数据,就必须限制在两个或三个维度上 因此,我们需要通过降维把无关或冗余的特征删掉。 ...原创 2019-10-04 19:25:42 · 654 阅读 · 0 评论 -
机器学习——逻辑回归
14 逻辑回归线性模型LR(没有考虑特征间的关联)——>LR +多项式模型(特征组合,不适用于特征稀疏场景,泛化能力弱)——>FM(适用于稀疏特征场景*,泛化能力强)——>FFM【省去零值特征,提高FFM模型训练和预测的速度,这也是稀疏样本采用FFM的显著优势】14.1 what‘s Logistic Regression 逻辑回归是一种用于解决二分类问题的机器学习...原创 2019-10-04 19:44:37 · 537 阅读 · 0 评论