主动学习
文章平均质量分 92
chad_lee
看论文的
展开
-
【主动学习 08】Learning loss for active learning (CVPR 2019 oral)
Learning loss for active learning 这篇文章idea虽然很fancy,还是CVPR oral,但是在社区讨论中评价并不是很好,效果难以复现。 Motivation 主动学习的query方法大多都是为了特定的目标任务精心设计,泛化性差;要么就是计算效率差,主动学习作为一个框架应该是任务无偏的。 方法 模型是任何任务的模型都可以,如图(a)只需要附加一个Loss prediction module,这个Loss prediction module的输入是“主模型”内部的每一层的原创 2021-08-26 13:46:45 · 618 阅读 · 0 评论 -
【主动学习 07】Fine-tuning Convolutional Neural Networks for Biomedical Image Analysis...(CVPR 2017 oral)
Fine-tuning Convolutional Neural Networks for Biomedical Image Analysis: Actively and Incrementally CVPR’2017 上篇ADMA中实验对比的二分类Baseline AIFT(Active incremental fine-tuning method)就来自这篇,这里的AIFT算法并不是着重于主动学习查询策略,而是在“预训练模型上持续的主动学习fine-tuning”这个概念,并且是零样本启动。这篇工作里的原创 2021-08-26 13:35:54 · 321 阅读 · 0 评论 -
【主动学习 06】Cost-Effective Training of Deep CNNs with Active Model Adaptation (KDD‘18)
Cost-Effective Training of Deep CNNs with Active Model Adaptation KDD’18 这篇文章设计的方法属实是复杂了一点,真的不好讲清楚。 也是黄圣君老师的文章,motivation是解决深度学习模型设计问题,提出的核心解决方案是在预训练模型上用主动学习fine-tuning,选样本在考虑分类不确定的同时,还考虑模型层中的特征表示(文章提出的distinctiveness***),即选择能让模型更快的学会当前任务*的特征的样本。这就是model a原创 2021-08-26 13:28:45 · 363 阅读 · 0 评论 -
【主动学习 05】Cost-Sensitive Online Active Learning with Application to Malicious URL Detection (KDD‘13)
Cost-Sensitive Online Active Learning with Application to Malicious URL Detection KDD’13 之前的主动学习文章的场景都是pool-based的,这篇是看的第一篇流式数据场景。 这篇文章也是KDD的文章,几个关键点和我们很像:对大量的序列做二分类、相较于平凡的分类任务数据不平衡严重、cost-sensitive、Active Learning。本文提出一个Cost-Sensitive Online Active Learni原创 2021-08-26 13:21:16 · 209 阅读 · 0 评论 -
【主动学习 04】Proactive Learning: Cost-Sensitive Active Learning with Multiple Imperfect Oracles(CIKM‘08)
Proactive Learning: Cost-Sensitive Active Learning with Multiple Imperfect Oracles CIKM’08 主动学习有几个假设前提:专家可靠(never wrong)、不知疲倦的(always answers)、只有一个、成本无差别(always free or charge the same)。这篇文章讨论不严格限制这四个条件。所以作者抽象了三个multi-oracle场景出来:1、专家有时拒绝标注;2、专家成本不固定;3、专家可能原创 2021-08-26 13:11:49 · 177 阅读 · 0 评论 -
【主动学习 03】Active Self-Paced Learning for Cost-Effective and Progressive Face Identification (PAMI‘18)
Active Self-Paced Learning for Cost-Effective and Progressive Face Identification (PAMI’18) 这篇工作的核心思想是“Cost-less-Earn-more”,意思是: Self-annotation for high-confident instances Oracle annotation for low-confident instances brief Introduction 在Active learni原创 2021-08-26 13:06:11 · 249 阅读 · 0 评论 -
【主动学习 02】Cost-Effective Active Learning from Diverse Labelers (IJCAI‘17)
Cost-Effective Active Learning from Diverse Labelers(IJCAI’17) 这篇文章指出在主动学习过程中标注数据时要考虑“Oracle are cost-sensitive”,有高质量、高成本的专家和低质量、低成本的专家可以选择来标注。这篇文章是的假设是:有多个专家,擅长的领域知识不同、质量也不同。 假设现在又一个小的有标签数据集L={(xi,yi)}i=1nlL=\left\{\left(\mathrm{x}_{i}, y_{i}\right)\rig原创 2021-08-26 13:00:34 · 218 阅读 · 0 评论 -
【主动学习 01】经典综述-Active Learning Literature Survey-Burr Settles(2009)
Active Learning Literature Survey - Burr Settles(2009) Settles’ Survey,主动学习领域最经典的survey,主要介绍survey中采样策略部分。 通常在C-U和U-S上有比较多的工作 查询函数Q:不确定性准则(uncertainty)和差异性准则(diversity) 1)不确定性准则对于不确定性,我们可以借助信息熵的概念来进行理解。我们知道信息熵是衡量信息量的概念,也是衡量不确定性的概念。信息熵越大,就代表不确定性越大,包含的信息量也就原创 2021-08-25 15:44:57 · 1655 阅读 · 1 评论