DAP模型(直接属性预测模型)
DAP可以理解为一个三层模型:第一层是原始输入层,例如一张电子图片(可以用像素的方式进行描述);第二层是p维特征空间,每一维代表一个特征(例如是否有尾巴、是否有毛等等);第三层是输出层,输出模型对输出样本的类别判断。在第一层和第二层中间,训练p个分类器,用于对一张图片判断是否符合p维特征空间各个维度所对应的特征;在第二层和第三层间,有一个语料知识库,用于保存p维特征空间和输出y的对应关系。
简单来讲,就是对输入的每一个属性训练一个分类器,然后将训练得出的模型用于属性的预测,测试时,对测试样本的属性进行预测,再从属性向量空间里面找到和测试样本最接近的类别。
直接属性预测方法有固定的类别-属性关系,通过样本与类别间的训练,蕴含了对属性值的训练,从而取得了相关的类别分类器参数。在测试阶段,测试样本的属性值可直接获取,从而可以推知样本所属的类别,这个类别也可以是一种训练阶段未见样本的类别。
可见样本类别y_1,…,y_k和未见样本的目标类别z_1,…,z_l以及它们的属性a_1,…,a_m之间的关系通过一个二值矩阵给出,矩阵中的值a_my,a_mz形成的编码表示了对于一个给定的类y或者z,属性a_m对于分类是有效还是无效。这个二值矩阵编码是通过人工有监督地给出的。属性分类器的训练通过那些可见的样本x 和类别标号y进行训练。在测试阶段,图像有效的属性a_m可以通过其后验概率p(a_m|x)表征,这个值可以通过之前训练的分类器给出;并且这些属性可以与待测试的类别z的后验概率建立起联系. 在识别阶段,同样可利用f(x)来获得最大似然的输出类,这个类别可能来自具有训练样本的y 类别空间,也可能来自未见训练样本的z类别空间。