机器学习
文章平均质量分 87
「已注销」
这个作者很懒,什么都没留下…
展开
-
02.机器学习样本评估与选择
02.机器学习样本评估与选择经验误差与过拟合精度=1-错误率=1-错误样本数/总样本数学习器的实际预测输出与样本的真实输出之间的差异称为“误差”(error),学习器在训练集上的误差称为“训练误差”(training error)或“经验误差”(empirical error),在新样本上的误差称为“泛化误差”(generalizationerror).显然,我们希望得到泛化误差小的学习器。模型选择(modelselection)问题:理想的解决方案当然是对候选模型的泛化误差进行评估,然后选择泛化原创 2021-09-04 23:42:14 · 1007 阅读 · 0 评论 -
02.样本评估与选择
02.样本评估与选择经验误差与过拟合精度=1-错误率=1-错误样本数/总样本数学习器的实际预测输出与样本的真实输出之间的差异称为“误差”(error),学习器在训练集上的误差称为“训练误差”(training error)或“经验误差”(empirical error),在新样本上的误差称为“泛化误差”(generalizationerror).显然,我们希望得到泛化误差小的学习器。模型选择(modelselection)问题:理想的解决方案当然是对候选模型的泛化误差进行评估,然后选择泛化误差最小原创 2021-09-04 23:36:12 · 712 阅读 · 0 评论 -
西瓜书第五章
西瓜书第五章神经元模型M-P神经元模型:n个其他单元的输入信号通过带权重的连接,总的输入值与阈值比较,通过激活函数处理产生输出。常见的激活函数有阶跃函数和Sigmoid函数11+????−????。感知机与多层网络感知机为两层网络,一层输入一层输出。学习目标为权重和阈值,其中阈值的学习也可以转化为权重。学习过程为????????←????????+Δ????????,Δ????????=????(????−????̂ )????????,其中????为学习率。可以证明线性可分的问题(可以使用线原创 2021-07-25 22:05:52 · 207 阅读 · 0 评论 -
西瓜书第四章
西瓜书第四章基本流程决策树的每一个叶子结点表示一个决策结果,每个中间节点表示一个属性测试。学习目的为生成一颗泛化能力强的决策树(处理未见示例能力强)决策树学习的基本过程是递归下降的划分过程,节点对给定的数据集和属性集学习并得到一个划分或者将自己标记为叶子结点。划分选择决策树学习的关键步骤在于选择合适的最优划分属性。信息增益使用信息熵(频率负对数的期望)来度量样本集合纯度。????????????(????)=−∑|????|????=1????????????????????2??????原创 2021-07-22 23:36:42 · 135 阅读 · 2 评论 -
03.线性模型概述
西瓜书第三章 线性模型简介给定由d个属性描述的示例x=(x1;x2;…;xd)\boldsymbol{x}=\left(x_{1} ; x_{2} ; \ldots ; x_{d}\right)x=(x1;x2;…;xd), 其中xix_{i}xi是 x\boldsymbol{x}x 在第 i 个属性上的取值,线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,即f(x)=w1x1+w2x2+…+wdxd+bf(x)=w_{1} x_{1}+w_{2} x_{2原创 2021-07-19 23:21:44 · 225 阅读 · 2 评论