![](https://img-blog.csdnimg.cn/20190927151132530.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据挖掘
文章平均质量分 84
Data Mining and Knowledge discovery
优惠券已抵扣
余额抵扣
还需支付
¥19.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
叼辣条闯天涯
菜鸟一枚
展开
-
【数据挖掘】2022年 Quiz 1-3 整理 带答案
AB, or C) and v01Figure 1 XBand v01B0C0[(100∣Yy⋅PrYyand Pr[(100∣Yn⋅PrYnYyand PrYnis 1/2[(100∣Yyand Pr[(100∣Yn[(100∣YyPrA1∣Yy⋅PrB0∣Yy⋅PrC0∣Yy43⋅21⋅41323。原创 2023-09-29 16:33:41 · 978 阅读 · 0 评论 -
【数据挖掘】2021年 Quiz 1-3 整理 带答案
and Bor B) and v0115. Les SAand B) and vH∣32Sh0.125−δDh≤errSh2∣S∣ln1/δln∣H∣0.12516ln1/δln320.1Dh≤0.12516ln1/0.1ln32≤BC1B1C0Yy∣A1B1C0PrA1B1C0PrA1B1C0。原创 2023-09-29 16:17:34 · 1128 阅读 · 0 评论 -
【数据挖掘】2019年 Quiz 1-2 整理 带答案
BC000−A0−20−C2−22∈Mbc∈R∈R2Mp⋅p1b⋅p2c≥0on R2′′on R2on R2.(a) 3 .′⊆M⊆R2′Pon R2′on R2. Let P02B20C10and D−20where BCDwith γguess1361xc2y0. Define cc1c20。原创 2023-09-29 15:41:05 · 883 阅读 · 0 评论 -
【数据挖掘】2017年 Quiz 1-3 整理 带答案
BC1B0C0?and B1B1C1?PrD∣ABCPrABCPrABC∣D⋅PrDPrABCPrab∣cd⋅Prc∣d⋅PrDPrABCPrA∣CD⋅PrB∣CD⋅PrC∣D⋅PrDPrA1B1C1⋅PrDy∣A1B1C1PrA1∣C1Dy⋅PrB1∣C1Dy⋅PrC1∣。原创 2023-09-29 15:32:03 · 691 阅读 · 0 评论 -
【数据挖掘】期末开卷笔记
数据挖掘课程开卷考试各章知识点总结原创 2023-02-15 19:56:52 · 253 阅读 · 0 评论 -
【数据挖掘】6. 核函数
目前为止我们还没有考虑不可分的数据集本节目的:使用核函数(将数据集映射到另一个更高维的空间)来解决不可分的数据集,来保证线性可分性动机提高维度可以保证线性可分性对于一维空间的一系列点,如图中 p1,p2,p3,p4,p5p_1, p_2,p_3,p_4,p_5p1,p2,p3,p4,p5 (此时先考虑点的数量是奇数),总能在二维空间找到一条曲线,将其根据标签划分开通过在每对不同标签的点之间随机选择一个点 qqq ,定义一个多项式函数:f(x)=−(x−q1)(x−q2)(x−q3)(x−q4)原创 2022-11-02 12:01:04 · 325 阅读 · 0 评论 -
【数据挖掘】7. 多类别分类 多类别分类感知器(Perceptron)
(此文中的 w 和 p 均为向量,并未标出向量箭头)多类别分类与单类别区别在定义上的区别如何在决策树和贝叶斯分类上应用多类别分类泛化后的线性分类器定义向量由 www 变为 w1,w2,⋯ ,wk∈Rdw_1,w_2,\cdots,w_k\in \mathbb{R}^dw1,w2,⋯,wk∈Rd ,对应每一个标签wi⋅pw_i\cdot pwi⋅p 取值最大时,标签为 iii如果 wi⋅p=wj⋅pw_i\cdot p=w_j\cdot pwi⋅p=wj⋅p , 定义一个策略,例如,选 i原创 2022-11-02 11:50:19 · 725 阅读 · 0 评论 -
【数据挖掘】4. 打散(Shattering) VC维数 基于VC维数和Margin的泛化定理
打散(Shattering)、 VC维数、 基于VC维数的泛化定理、基于Margin的泛化定理、普通泛化定理和前两者的关系原创 2022-10-19 13:05:58 · 607 阅读 · 0 评论 -
【数据挖掘】3. 线性分类 感知器
是线性划分平面的法向量(个人感觉可以理解为已经调整好的。没有更多的 violation point ,终止。Perceptron 进行调整的次数最多为。本节解决的问题:寻找线性划分平面,使得。解决方法:Perceptron(感知器)在法向量上映射的长度,对于。Perceptron 感知器。向量),划分平面经过原点。原创 2022-10-04 16:36:57 · 597 阅读 · 0 评论 -
【数据挖掘】2. 贝叶斯分类器
上边的贝叶斯分类器依赖于上述假设,即有条件独立(conditional independence)哪个更大,即可确定预测的标签,使用训练集估计它们。,我们将其估计为很小的值,比如 0.000001。对于实例空间中一个固定的点。对于没有出现的情况,比如。,如果给定一个类标签。原创 2022-09-24 16:45:14 · 519 阅读 · 2 评论 -
【数据挖掘】1. 决策树、Hunt算法、泛化定理
泛化误差:在一个相当相当大的训练集,或者无穷大,包含了所有可能出现的情况的集合,被。1减训练集S中yes占比和no占比的平方和,取值范围0-0.5。决策树——Hunt’s algorithm(贪心),当训练集的大小相当大时,分类器的可靠性才足够好。是可能返回的分类器的集合,下边的声明具有至少。划分质量:GINI split 越小,划分越好。,那么至少一个分类器失败的概率为最多。,所以没有分类器失败的概率为最少。寻找一个泛化误差比较小的分类器。的准确信息,所以我们只能用从。每一个分类器失败的概率最多为。原创 2022-09-24 14:18:25 · 1169 阅读 · 0 评论