- 博客(6)
- 资源 (1)
- 收藏
- 关注
转载 (六)聚类
0 性能度量性能度量/有效性指标:外部指标与内部指标数据集D={x1,x2,…,xm}D=\left\{\boldsymbol{x}_{1}, \boldsymbol{x}_{2}, \ldots, \boldsymbol{x}_{m}\right\}D={x1,x2,…,xm},聚类得到的簇划分为 C={C1,C2,…,Ck}\mathcal{C}=\left\{C_{1},C_{2...
2019-06-20 13:37:00 137
转载 (五)支持向量机
0 基础:感知机模型目标是找到超平面θ0+θ1x1+…+θnxn=0\theta_{0}+\theta_{1} x_{1}+\ldots+\theta_{n} x_{n}=0θ0+θ1x1+…+θnxn=0分隔数据,即感知机模型:y=sign(θ∙x)y=\operatorname{sign}(\theta \bullet x)y=sign(θ∙x)正确分类的样本满足yθ∙x&a...
2019-06-20 13:36:33 227
转载 (四)集成学习
0 概述baggingboosting1 结合策略平均法:常用于回归投票法:常用于分类学习法:stacking2 典型模型2.1 随机森林
2019-06-20 13:36:21 219
转载 (二)线性模型
0 基本形式f(x)=w1x1+w2x2+…+wdxd+bf(\boldsymbol{x})=w_{1} x_{1}+w_{2} x_{2}+\ldots+w_{d} x_{d}+bf(x)=w1x1+w2x2+…+wdxd+b, or f(x)=wTx+bf(\boldsymbol{x})=\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}+bf...
2019-06-20 13:35:41 312
转载 (一) 模型评估与选择
0 概述训练误差:在训练集上的误差泛化误差:在新样本上的误差目标:得到泛化误差小的学习器过拟合与欠拟合:把训练样本的特点当作所有样本的特点,泛化性能下降;训练样本的一般性质尚未学习好1 模型评估通过测试集上的测试误差作为泛化误差的近似。如何得到测试集?留出法,k-fold, 自助法1.1 留出法将数据集D划分为训练集S和测试集T,S与T互斥划分要尽量保持数据分布的一致...
2019-06-20 13:35:16 282
python for data analysis-USDA食品数据json及ipynb文件
2018-04-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人