Scalable Algorithms for Multi-Instance Learning

Scalable Algorithms for Multi-Instance Learning

多示例学习的可扩展算法

时间:2022/12/6

bib

@article{wei2016scalable,
  title={Scalable algorithms for multi-instance learning},
  author={Wei, Xiu-Shen and Wu, Jianxin and Zhou, Zhi-Hua},
  journal={IEEE transactions on neural networks and learning systems},
  volume={28},
  number={4},
  pages={975--987},
  year={2016},
  publisher={IEEE}
}

主要贡献

为了解决大规模的MIL问题,提出了基于局部聚合描述子表示向量的MIL和基于Fisher向量表示的miFV两种高效可扩展的MIL算法。

miVLAD和miFV由于映射步骤的计算成本低,线性分类器的可扩展性强,能够高效、有效地处理大规模MIL数据。实验表明,miVLAD和miFV不仅与最先进的MIL算法具有相当的准确率,而且速度快了数百倍。

可以将新的miVLAD和miFV表示视为多视图数据,这在大多数情况下提高了准确率。

主要内容

VLAD表示和FV表示是计算机视觉中的两种方法。给定一幅图像和一组从该图像中提取的描述符(向量)(例如,SIFT), VLAD或FV将它们编码为高维向量,这就是新的图像级签名。

一、miVLAD

1.主要思想

首先从整个训练集实例空间中寻找K个向量,即“描述符”。文章所采用的方法是对训练实例空间进行K-means聚类,选取K个簇中心来作为描述符即 C = { c 1 , . . . c k , . . . , c K } C=\{c_1,...c_k,...,c_K\} C={c1,...ck,...,cK},这里作者将 C C C称作codebook,即“密码本”。如同传统密码学中的加解密的依据,这里也将这个 C C C作为之后编码的基础依据。而由于每一个聚类中心 c i c_i ci都是隶属于一个簇,则在这个簇内的实例 x i j x_{ij} xij(第i个包的第j个实例)都是隶属于这个簇中心 c i c_i ci,则记录每个实例与其簇中心/描述符的对应关系 c k = N N ( x i j ) c_k=NN(x_{ij}) ck=NN(xij)

之后通过如算法2所示映射函数将一个包 X i X_i Xi转换成一个向量 v i v_i vi,具体来说则是通过如下公式进行差值计算:

v i k l = ∑ x i j ∈ Ω x i j l − c k l (1) v_{ikl}=\sum_{x_{ij}\in\Omega}x_{ijl}-c_{kl} \tag{1} vikl=xijΩxijlckl(1)

Ω = { x i j ∣ N N ( x i j ) = c k } \Omega=\{x_{ij}|NN(x_{ij})=c_k\} Ω={xijNN(xij)=ck} ,这里 v i v_i vi的维度为D=K x d。 v i k l v_{ikl} vikl表示 v i v_i vi的第k个分量的第 l l l个属性, x i j l x_{ijl} xijl c k l c_{kl} ckl分别表示实例 x i j x_{ij} xij及其对应质心 c k c_k ck的第 l l l个属性。其中,vi中的每个元素都是$v_{il}\leftarrow sign(v_{il}) \sqrt{|v_{il}|} 。 然 后 , 将 新 的 特 征 向 量 v i 通 过 。然后,将新的特征向量vi通过 viv_i←v_i /{||v_i||}^2$ 归一化。最终包便转换成特征向量。

之后便使用转换后的向量来训练单实例分类器得到模型M()。预测时便先将待预测的包通过算法2的映射函数转换成特征向量,之后使用训练好的模型来预测。

2.算法伪代码

在这里插入图片描述
在这里插入图片描述

实时系统是指在严格的时间限制下,对输入数据进行处理并及时产生输出响应的系统。在实时系统中,一个重要的因素是系统的架构设计,而对于实时系统的架构设计来说,一个关键的考虑因素是其鲁棒性和可扩展性。 所谓鲁棒性,是指系统能够应对各种异常情况和外部干扰而保持正常工作的能力。在实时系统中,鲁棒的架构可以通过多种方式实现,例如使用冗余设计和错误处理机制。冗余设计可以通过多个处理器或模块的冗余部署来提高系统的容错能力,以便在一个处理器或模块发生故障时,系统依然能够正常工作。而错误处理机制可以包括错误检测和错误恢复两个方面,以保证系统对错误的及时发现和恢复能力。 可扩展性是指系统能够根据实际需求进行灵活的扩展和升级的能力。对于实时系统来说,可扩展的架构可以基于不同的需求进行模块的添加或替换,以满足不同规模和性能要求的系统。例如,当实时系统的负载增加时,可以通过增加处理器数量或增加存储容量来扩展系统的性能。 对于实时系统的架构设计,一个常用的方法是采用分布式架构。在分布式架构中,系统的不同功能模块可以分布在不同的节点上,通过通信和协作来完成任务。这种设计能够充分利用分布式计算和通信的特点,提高系统的并行度和可靠性。 综上所述,Robust scalable architecture for real-time systems(实时系统的强韧可扩展架构)PDF提供了一种鲁棒性和可扩展性的实时系统架构设计方案。该架构通过冗余设计和错误处理机制实现系统的鲁棒性,同时采用分布式架构实现系统的可扩展性。这样的架构设计能够有效应对实时系统中的异常情况和外部干扰,并能够根据实际需求灵活扩展系统的性能和规模。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值