GutsShinyHero-CSDN博客

原创 [面向I2I域适应的自监督CycleGAN，论文个人阅读分享]Self-Supervised CycleGAN for Object-Preserving Image-to-Image Domain

问题：基于生成对抗网络（GAN）的方法（例如 CycleGAN）很容易无法在图像到图像的转换中保留图像对象，这降低了它们在域适应等任务上的实用性。已经提出一些框架采用分割网络作为辅助正则化以防止内容失真。然而，它们都需要额外的像素级注释，这在实际应用中很难实现。在本文中，我们提出了一种新颖的 GAN（即 OP-GAN）来解决该问题，其中涉及一个自监督模块，用于在图像到图像转换过程中强制图像内容的一致性，而无需任何额外的注释。我们在三个公开可用的数据集上评估了所提出的 OP-GAN。

2024-05-30 16:03:55 682 1

原创 [对基于Transformer的域适应的改进Safe Self-Refinement，论文个人阅读]Safe Self-Refinement for Transformer-based Domain

首先，受到视觉 Transformer 在各种视觉任务中取得成功的鼓舞，为 SSRT 配备了 Transformer 主干。Vision Transformer与简单对抗性适应的结合超过了在具有挑战性的 DomainNet 基准上最好报道的基于卷积神经网络 (CNN) 的结果，显示出其强大的可转移特征表示为了降低模型崩溃的风险并提高差距较大的领域之间知识转移的有效性，提出了安全自我改进策略。具体来说，SSRT 利用扰动目标域数据的预测来完善模型。

2024-05-30 15:50:50 1027

原创 [域适应的Cycle Self-Training，论文个人阅读分享]Cycle Self-Training for Domain Adaptation

无监督域适应（UDA）的主流方法学习域不变表示来缩小域转移，这在经验上是有效的，但在理论上受到困难或不可能性定理的挑战。在 UDA 中的自我训练通过使用目标伪标签进行训练来利用未标记的目标数据，但是，在分布变化下，伪标签与目标地面事实的巨大差异可能是不可靠的。在本文中，提出了循环自训练（CST），这是一种有原则的自训练算法，可明确强制伪标签跨域泛化。CST 在正向步骤和反向步骤之间循环，直到收敛。在前向步骤中，CST 使用源训练分类器生成目标伪标签。

2024-05-30 15:38:17 593

原创 [强化学习](2)DQN,SARSA,Reinforce方法和时序差分

主要介绍强化学习中的DQN，SASRA，Reinforce方法

2024-04-01 20:35:35 1012

原创 [强化学习](1)基本概念与方法

本质上是动态序贯优化问题，一般采用马尔科夫决策过程（Markov Decision Process, MDP）进行建模。MDP描述了序贯决策的智能体与环境的交互过程。

2024-03-25 16:44:34 468 1

原创 [GPU与CPU100倍性能之谜，论文个人阅读分享]Debunking the 100X GPU vs. CPU myth: an evaluation of throughput computing

本文分析的计算对象是一组重要的吞吐量计算内核，这些内核中有足够的并行性足以适配多核CPU和GPU，过去(2010）一些年中GPU在这些计算内核上显示出持续上升的加速性能，从10X到1000X，本文揭示了巨大性能差距的原因；进行了严密的性能分析，发现在为GPU和CPU都应用加速方法后，Nvdia GTX280和Core i7-960之间的性能差距平均只有2.5X。讨论了关于CPU和GPU的加速技术，分析两种架构中引起不同的性能影响因素，提供了一组架构层面上显著提高吞吐率内核性能的因子。

2024-03-22 15:56:14 901 1

原创 [Bloom过滤器，论文个人阅读分享]Network Applications of Bloom Filters: A Survey

Bloom filter是一个简单的空间高效的随机数据结构，用于表示支持成员查询的集合。Bloom 过滤器允许误报，在控制错误的概率的条件下，节省空间的优势可以一定克服这个缺点。自 1970 年代以来，Bloom filter已被用于数据库应用程序，但直到最近几年，它们在网络文献中变得流行。本文的目的是调查Bloom filter在各种网络问题中已经被使用和改进的方式，目的是提供一个统一的数学和实用的框架来理解它们，并刺激它们在未来应用中的使用。

2024-03-21 23:13:00 905 1

原创【并行程序性能分析】学习《MPI与Open MP并行程序设计:C语言版》

○ Amdahl定律这是向前看的定律。该定律依赖于对串行程序的评估来预测在并行计算系统上执行程序以加速程序中可并行部分的执行时，所能达到的加速比上限。○ Gustafson Barsis定律这是向后看的定律。该定律依赖于对并行程序的测试以预测程序在具有足够内存的串行处理器上的执行时间。由于处理器个数增加时可以增加问题的规模，我们称Gustafson-Baris定律提供了比例加速比的估算。○ Kap-Flatt度量考察了并行程序在解决固定规模问题时加速比。

2024-03-21 21:13:18 915

原创 [面向多核的BLIS优化,论文个人阅读分享]Anatomy of High-Performance Many-Threaded Matrix Multiplication

描述BLIS如何扩展GotoBLAS来实现矩阵乘法(GEMM)。GEMM以前是围绕一个内部内核实现的三个循环，而BLIS在这个内部内核中公开了两个额外的循环，将计算转换为BLIS微内核，这样移植GEMM就变成了为给定的体系结构定制这个微内核的问题。我们将讨论这如何促进更精细的并行性，从而极大地简化了GEMM的多线程，以及并行多个循环的额外机会。

2024-03-21 19:55:06 770 1

原创 [用于软件缺陷检测的DL模型调查，论文个人学习分享]An Empirical Study of Deep Learning Models for Vulnerability Detection

尽管现在有许多大模型被提出，并且在一些情景中DL模型已经远远超过静态的方法，但是我们对这些模型的机制仍然没有很好的理解，这限制模型的鲁棒性，调试和对故障检测的应用的长足发展。这篇文章主要工作是：1. 在常用的故障检测数据集Devign和MSR上研究并复现了9种最流行的DL模型。研究了关于模型能力，训练数据和模型解释性三个方面上的六个问题。2. 通过实验证明了模型的不同运行与不同模型输出之间的低一致性之间的可变性。3. 研究比较了针对特定类型的漏洞训练的模型和一次所有漏洞训练的模型。

2024-03-21 19:40:47 1011

原创 [BLIS参数分析，论文个人阅读分享]Analytical Modeling Is Enough for High-Performance BLIS

展示了类似BLAS的库实例化软件(BLIS)框架，提供了GotoBLAS(现在维护为OpenBLAS)实现的更详细的分层，允许在数学上分析地确定矩阵乘法的高端实例化的调优参数。从多级cache的角度建立了关于GotoBLAS方法的五个参数mrm_rmrnrn_rnrmcm_cmckck_ckcncn_cnc的数学模型，为BLIS在复杂高性能体系结构的应用提供了一种参数分析方法。

2024-03-21 16:43:18 728 1

GutsShinyHero的博客