![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习笔记
SherryLiang00
这个作者很懒,什么都没留下…
展开
-
(一) 模型评估与选择
0 概述训练误差:在训练集上的误差泛化误差:在新样本上的误差目标:得到泛化误差小的学习器过拟合与欠拟合:把训练样本的特点当作所有样本的特点,泛化性能下降;训练样本的一般性质尚未学习好1 模型评估通过测试集上的测试误差作为泛化误差的近似。如何得到测试集?留出法,k-fold, 自助法1.1 留出法将数据集D划分为训练集S和测试集T,S与T互斥划分要尽量保持数据分布的一致...转载 2019-06-20 13:35:16 · 270 阅读 · 0 评论 -
(二)线性模型
0 基本形式f(x)=w1x1+w2x2+…+wdxd+bf(\boldsymbol{x})=w_{1} x_{1}+w_{2} x_{2}+\ldots+w_{d} x_{d}+bf(x)=w1x1+w2x2+…+wdxd+b, or f(x)=wTx+bf(\boldsymbol{x})=\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}+bf...转载 2019-06-20 13:35:41 · 297 阅读 · 0 评论 -
(三)决策树
0 基本流程每个结点对应一个属性测试,结点包含的样本集合根据结果分到不同的子结点转载 2019-06-20 13:36:05 · 200 阅读 · 0 评论 -
(四)集成学习
0 概述baggingboosting1 结合策略平均法:常用于回归投票法:常用于分类学习法:stacking2 典型模型2.1 随机森林转载 2019-06-20 13:36:21 · 209 阅读 · 0 评论 -
(五)支持向量机
0 基础:感知机模型目标是找到超平面θ0+θ1x1+…+θnxn=0\theta_{0}+\theta_{1} x_{1}+\ldots+\theta_{n} x_{n}=0θ0+θ1x1+…+θnxn=0分隔数据,即感知机模型:y=sign(θ∙x)y=\operatorname{sign}(\theta \bullet x)y=sign(θ∙x)正确分类的样本满足yθ∙x&a...转载 2019-06-20 13:36:33 · 209 阅读 · 0 评论 -
(六)聚类
0 性能度量性能度量/有效性指标:外部指标与内部指标数据集D={x1,x2,…,xm}D=\left\{\boldsymbol{x}_{1}, \boldsymbol{x}_{2}, \ldots, \boldsymbol{x}_{m}\right\}D={x1,x2,…,xm},聚类得到的簇划分为 C={C1,C2,…,Ck}\mathcal{C}=\left\{C_{1},C_{2...转载 2019-06-20 13:37:00 · 125 阅读 · 0 评论