[NeurIPS 2019] Hyperspherical Prototype Networks

Introduction

  • 作者提出 hyperspherical prototype networks,可以利用 prototypes 以统一的框架完成分类和回归任务

Hyperspherical prototypes

Classification

在这里插入图片描述

  • Positioning hyperspherical prototypes. 在训练模型之前,作者先提前确定 hyperspherical prototypes 的位置,使其均匀分布在整个超球上。设最优的 prototypes 集合为 P ∗ \mathbf P^* P,则 P ∗ \mathbf P^* P 会使得任意两个 prototypes 间的最大余弦距离最小,即
    在这里插入图片描述将上式中的 max ⁡ ( k , l , k ≠ l ) ∈ C cos ⁡ θ ( p k ′ , p l ′ ) \max _{(k, l, k \neq l) \in C} \cos \theta_{\left(\mathbf{p}_k^{\prime}, \mathbf{p}_l^{\prime}\right)} max(k,l,k=l)Ccosθ(pk,pl) 作为损失函数,用梯度下降法优化即可得到 hyperspherical prototypes. 但作者认为这样优化效率太低,因为每次需要计算出所有 prototypes 间的余弦距离但却只优化距离最大的一对 prototypes,为此,作者提出采用以下损失函数,对每个 prototype,优化其距离最大的一对 prototypes,每次优化 K K K 对 prototypes
    在这里插入图片描述其中, K K K 为类别数, C C C 为类别集合, P ^ P ^ T \hat {\mathbf P}\hat {\mathbf P}^T P^P^T 为 pairwise prototype similarities,减去 2 I 2\mathbf I 2I 是为了避免 self selection. 将上式作为损失函数使用梯度下降法优化 prototypes,再将其投影回超球,不断迭代即可得到理想的 hyperspherical prototypes (SGD, with a learning rate of 0.01, momen-tum of 0.9)
  • Prototypes with privileged information. 为了进一步融入类别的语义信息,使得语义接近的 prototypes 相较于语义不同的 prototypes 间更加接近,作者利用了类别名的 word embed W = { w 1 , . . . , w K } \mathbf W=\{\mathbf w_1,...,\mathbf w_K\} W={w1,...,wK},引入了如下 ranking-based loss function,
    在这里插入图片描述其中, T T T 为所有类别三元组的集合,ground truth S ˉ i j k = ⟦ cos ⁡ θ w i , w j ≥ cos ⁡ θ w i , w k ⟧ \bar S_{ijk}=\llbracket \cos \theta_{\mathbf{w}_i, \mathbf{w}_j} \geq \cos \theta_{\mathbf{w}_i, \mathbf{w}_k} \rrbracket Sˉijk=[[cosθwi,wjcosθwi,wk]],output S i j k ≡ e o i j k 1 + e o i j k S_{i j k} \equiv \frac{e^{o_{i j k}}}{1+e^{o_{i j k}}} Sijk1+eoijkeoijk o i j k = cos ⁡ θ p i , p j − cos ⁡ θ p i , p k o_{ijk}=\cos\theta_{\mathbf p_i,\mathbf p_j}-\cos\theta_{\mathbf p_i,\mathbf p_k} oijk=cosθpi,pjcosθpi,pk. 上述两个损失函数相加即为最终的 hyperspherical prototypes 预训练损失函数
  • Classification. 损失函数最大化样本特征和其 class prototype 间的余弦距离,并且在此过程中不更新 prototypes
    在这里插入图片描述推理时,模型的预测结果为
    在这里插入图片描述

Regression

在这里插入图片描述

  • 在进行回归时,假设回归值的上下限分别为 v u , v l v_u,v_l vu,vl,作者为 v u , v l v_u,v_l vu,vl 各自设定了两个 prototypes p u , p l \mathbf p_u,\mathbf p_l pu,pl 并规定它们方向相反,即 cos ⁡ θ p u , p l = − 1 \cos\theta_{\mathbf p_u,\mathbf p_l}=-1 cosθpu,pl=1,训练时的损失函数为
    在这里插入图片描述样本特征与 p u \mathbf p_u pu 间的余弦相似度即为归一化后的预测值
    在这里插入图片描述
  • Our approach to regression differs from standard regression, which backpropagate losses on one-dimensional outputs. In the context of our work, this corresponds to an optimization on the line from p u \mathbf p_u pu to p l \mathbf p_l pl. Our approach generalizes regression to higher dimensional output spaces. While we still interpolate between two points, the ability to project to higher dimensional outputs provides additional degrees of freedom to help the regression optimization. As we will show in the experiments, this generalization results in a better and more robust performance than mean squared error.

Joint regression and classification

  • hyperspherical prototype networks 可以在同一个超球上完成分类和回归任务,只需要满足回归任务上下限对应的 prototypes 对应欧式空间的一个轴,其余轴则用于分类任务

Experiments

Classification

  • Evaluating hyperspherical prototypes
    在这里插入图片描述在这里插入图片描述
  • Prototypes with privileged information.
    在这里插入图片描述
  • Comparison to other prototype networks.
    在这里插入图片描述
  • Comparison to softmax cross-entropy. We conclude that we are comparable to softmax cross-entropy for sufficient examples and preferred when examples per class are unevenly distributed or scarce.
    在这里插入图片描述

Regression

在这里插入图片描述

Joint regression and classification

  • Rotated MNIST. We classify the digits and regress on their rotation. We employ S 2 \mathbb S^2 S2 as output, where the classes are separated along the ( x , y ) (x, y) (x,y)-plane and the rotations are projected along the z z z-axis.
    在这里插入图片描述
  • Predicting creation year and art style.
    在这里插入图片描述

References

Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
各种安全相关思维导图整理收集。渗透步骤,web安全,CTF,业务安全,人工智能,区块链安全,数据安全,安全开发,无线安全,社会工程学,二进制安全,移动安全,红蓝对抗,运维安全,风控安全,linux安全.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值