transductive inference（转导推理，直推式学习）

最新推荐文章于 2023-12-20 09:26:25 发布

大笨熊。。。

最新推荐文章于 2023-12-20 09:26:25 发布

阅读量2.6k

点赞数 2

分类专栏：机器学习文章标签：统计学习机器学习

机器学习专栏收录该内容

10 篇文章 1 订阅

订阅专栏

在统计学习中，转导推理（Transductive Inference）是一种通过观察特定的训练样本，进而预测特定的测试样本的方法。另一方面，归纳推理（Induction Inference）先从训练样本中学习得到通过的规则，再利用规则判断测试样本。然而有些转导推理的预测无法由归纳推理获得，这是因为转导推理在不同的测试集上会产生相互不一致的预测。

归纳推理中的一个经典方法是贝叶斯决策，通过求解P(Y|X)=P(X|Y)P(Y)/P(X)得到从样本X到类别Y的概率分布P(Y|X)，进而使用P(Y|X)预测测试样本的类别。这一过程的缺点在于，在预测某一测试样本的类别之前，先要建立一个更通用的判别模型。那么是否能够更直接判别测试样本的类别呢？一个办法就是通过转导推理。转导推理由Vladimir Naumovich Vapnik（弗拉基米尔·万普尼克）于20世纪90年代最先提出，其目的就在于建立一个更适用于问题域的模型，而非一个更通用的模型。这方面的经典算法有最近邻（K Nearest Neighbour）和支持向量机（Support Vector Machine）等。

　　特别是当训练样本非常少，而测试样本非常多时，使用归纳推理得到的类别判别模型的性能很差，转导推理能利用无标注的测试样本的信息发现聚簇，进而更有效地分类。而这正是只使用训练样本推导模型的归纳推理所无法做到的。一些学者将这些方法归类于半监督模型（Semi-Supervised Learning），但Vapnik认为是转导推理3。这方面的经典算法有转导支持向量机（Transductive Support Vector Machine）等。

　　转导推理的产生的第三个动机在于模型近似。在某些工程应用中，严格的推导所产生的计算量可能是非常巨大的，工程人员希望找到某些近似模型能适应他们所面临的特定问题，不需要适用于所有情况。

转导推理会利用所有点的信息进行预测，也就是说转导推理会根据数据所从属的类簇进行类别标注。这样中间红色圈的点由于非常接近标为B的点所从属的类簇，就会标注为B。可以看出转导推理的优势就在于其能通过少量的标注样本进行预测。而其不足之处就在于其没有预测模型。当新未知点加入数据集时，转导推理可能需要与数据量成正比的计算来预测类别，特别是当新数据不断地被获取和加入时，这种计算量的增长显得犹为突出，而且新数据的添加可能会造成旧数据类别的改变（根据实际应用的不同，可能是好的，也可能是坏的）。相反地，归纳推理由于有模型存在，在计算量上可能会优于转导推理（模型的更新可能增加计算量）。

大笨熊。。。

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
transductive inference（转导推理，直推式学习）

在统计学习中，转导推理（Transductive Inference）是一种通过观察特定的训练样本，进而预测特定的测试样本的方法。另一方面，归纳推理（Induction Inference）先从训练样本中学习得到通过的规则，再利用规则判断测试样本。然而有些转导推理的预测无法由归纳推理获得，这是因为转导推理在不同的测试集上会产生相互不一致的预测。归纳推理中的一个经典方...
复制链接

扫一扫

专栏目录