SherryLiang00-CSDN博客

转载（六）聚类

0 性能度量性能度量/有效性指标：外部指标与内部指标数据集D={x1,x2,…,xm}D=\left\{\boldsymbol{x}_{1}, \boldsymbol{x}_{2}, \ldots, \boldsymbol{x}_{m}\right\}D={x1,x2,…,xm}，聚类得到的簇划分为 C={C1,C2,…,Ck}\mathcal{C}=\left\{C_{1},C_{2...

2019-06-20 13:37:00 137

转载（五）支持向量机

0 基础：感知机模型目标是找到超平面θ0+θ1x1+…+θnxn=0\theta_{0}+\theta_{1} x_{1}+\ldots+\theta_{n} x_{n}=0θ0+θ1x1+…+θnxn=0分隔数据，即感知机模型：y=sign⁡(θ∙x)y=\operatorname{sign}(\theta \bullet x)y=sign(θ∙x)正确分类的样本满足yθ∙x&a...

2019-06-20 13:36:33 227

转载（四）集成学习

0 概述baggingboosting1 结合策略平均法：常用于回归投票法：常用于分类学习法：stacking2 典型模型2.1 随机森林

2019-06-20 13:36:21 219

转载（三）决策树

0 基本流程每个结点对应一个属性测试，结点包含的样本集合根据结果分到不同的子结点

2019-06-20 13:36:05 210

转载（二）线性模型

0 基本形式f(x)=w1x1+w2x2+…+wdxd+bf(\boldsymbol{x})=w_{1} x_{1}+w_{2} x_{2}+\ldots+w_{d} x_{d}+bf(x)=w1x1+w2x2+…+wdxd+b, or f(x)=wTx+bf(\boldsymbol{x})=\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}+bf...

2019-06-20 13:35:41 312

转载 (一) 模型评估与选择

0 概述训练误差：在训练集上的误差泛化误差：在新样本上的误差目标：得到泛化误差小的学习器过拟合与欠拟合：把训练样本的特点当作所有样本的特点，泛化性能下降；训练样本的一般性质尚未学习好1 模型评估通过测试集上的测试误差作为泛化误差的近似。如何得到测试集？留出法，k-fold, 自助法1.1 留出法将数据集D划分为训练集S和测试集T，S与T互斥划分要尽量保持数据分布的一致...

2019-06-20 13:35:16 282

python for data analysis-USDA食品数据json及ipynb文件

2018-04-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 （六）聚类

转载 （五）支持向量机

转载 （四）集成学习

转载 （三）决策树

转载 （二）线性模型