自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

翻译 Bringing in the technological, ethical, educational and social-structural for a new education data

对全面的教育数据治理的需求持续增长,即对谁收集哪些数据、如何使用数据以及为什么进行监管。从技术上讲,数据可以由第三方收集,使学校无法控制其使用。随着企业继续利用现有漏洞,法律框架部分实现了数据治理。教育数据使用实践事先不经过伦理审查。在个人层面上,学生对这些做法没有代理权。换句话说,在日益数字化的教育部门中,没有连贯且有意义的监督和数据治理框架来确保负责任的数据使用。在本文中,我将美国一个学区的教育数据交易引起的问题置于上下文中。

2023-09-07 19:41:49 119

翻译 Investigation on the influence mechanism of polyurea material property on the blast resistance of po

聚脲在防爆中的应用受到广泛关注。为研究不同力学性能聚脲对钢板结构抗爆性能的影响及机理,选取两种不同 力学性能(高硬度和延展性)的聚脲涂覆在碳钢板上。定量比较了两类聚脲在准静态和动态条件下的力学性能。对复合板进行了一系列爆炸荷载试验。得到了不同构思目标的宏观损伤特征。结合金相显微镜和扫描电镜,研究 了钢板和聚脲的显微破坏特征。傅里叶变换红外揭示了不同类型聚脲的能量吸收机理。结果表明,高硬度聚脲在 正面涂覆时只能略微提高钢板的抗爆性能。

2023-09-07 18:59:52 102

翻译 DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

大型文本到图像模型在AI的发展中实现了显着的飞跃,能够从给定的文本提示对图像进行高质量和多样 化的合成。给定仅输入子ject的几个 图像,我们微调预训练的文本到图像模型,使其学习 将唯一标识符与该特定子ject绑定。一旦主体嵌入到 模型的输出域中,唯一标识符就可用于合成在不同场 景中上下文中的主体的新颖逼真图像。通过利用嵌入 模型中的语义先验与新的自生类特定先验保存损失, 我们的技术能够在参考图像中未出现的各种场景、姿 势、视图和照明条件中合成主体。

2023-08-27 21:37:46 153

原创 Strip Pooling: Rethinking Spatial Pooling for Scene Parsing对场景分析空间池的再思考

空间池化已被证明在像素级预测任务(如场景解析)捕获远程上下文信息方面非常有效。在本文中,除了常规的N×N形状的空间池化外,我们还引入了一种新的池化策略,称为条带池化,它考虑了一个长而窄的核,即1×N或N×1。

2023-02-08 15:05:43 314

原创 Single Shot Instance Segmentation with Polar Representation基于极坐标表示的单阶段实例分割

在本文中,我们介绍了一种无锚框和单阶段实例分割方法,它在概念上很简单,完全卷积并且可以通过轻松地将其嵌入到大多数现成的检测方法中来使用。我们的方法称为 PolarMask,将实例分割问题表述为通过实例中心分类和极坐标中的密集距离回归来预测实例的轮廓。此外,我们提出了两种有效的方法来分别处理采样高质量中心示例和优化密集距离回归,这可以显着提高性能并简化训练过程。

2023-02-08 15:03:53 130

原创 Cross-domain Correspondence Learning for Exemplar-based Image Translation基于示例的图像翻译的跨域对应学习

本文提出了一个基于示例的图像翻译的通用框架 ,它在给定一个示例图像。输出具有与范例中语义对应对象一致的样式(例如,颜色、纹理)。本文建议共同学习跨域对应和图像翻译,这两项任务相互促进,因此可以在弱监督下学习。来自不同域的图像首先与建立密集对应的中间域对齐。然后,网络根据样本中语义对应的补丁的出现来合成图像

2023-02-08 15:01:06 247

原创 Cross-Modality Paired-Images Generation for RGB-Infrared Person Re-Identification用于RGB-红外人重新识别的跨模态配

RGB 红外 (IR) 行人重新识别非常具有挑战性, 因为 RGB 和 IR 图像之间存在较大的跨模态变化。关键的解决方案是学习桥接 RGB 和 IR 模态的对齐特征。然而,由于每对 RGB 和 IR 图像之间缺乏对应标签,大多数方法试图通过减少整个 RGB 和 IR 集之间的距离来减轻集级对齐的变化。然而,这种设置级对齐可能会导致某些实例的未对齐,从而限制了 RGB-IR Re-ID 的性能。与现有方法不同,在本文中,我们建议生成跨模态配对图像并执行全局集级和细粒度实例级对齐。我们提出的方法有几个优点。首

2023-02-08 14:58:43 396

原创 Traffic thermal infrared texture generation based on siamese semantic CycleGAN基于孪生语义CycleGAN的交通热红外纹

热红外纹理生成是一种很有前途的红外成像框架,适用于各种应用。 针对热红外系统,提出了一种基于孪生语义 CycleGAN (SS-CycleGAN) 的新型热红外纹理生成算法。 与传统的红外仿真框架不同,SS-CycleGAN 不依赖于额外的环境信息,例如空气温度、湿度和物体的辐射特性。 换句话说,在通过训练 CNN 充分理解交通场景后,可见图像可以像使用风格转换算法一样直接转换为热红外图像。 在本文中,首先引入了风格迁移,用于从彩色可见图像生成热纹理。 设计并引入了用于可见红外变换的连体语义损失,以生成面向

2023-02-08 14:56:41 321 1

原创 Zero-Learning Fast Medical Image Fusion零学习快速医疗图像融合

临床应用,如图像引导手术和无创诊断,严重依赖于多模态图像。医学图像融合通过将来自多个来源的信息整合到一个单一的、更易于理解的输出中发挥着核心作用。本文提出了一种实时图像融合方法,使用预先训练的神经网络来生成包含来自多模态来源的特征的单个图像。使用基于从卷积神经网络中提取的深度特征图的新策略合并图像。比较这些特征图以生成驱动多模态图像融合过程的融合权重。本文的方法不限于融合两个图像,它可以应用于任意数量的输入源。本文验证了我们提出的方法在多个医学融合类别上的有效性。实验结果表明,本文的技术在视觉质量、客观评

2023-02-08 14:53:46 510

原创 Infrared and visible image fusion using Latent Low-Rank Representation使用潜在低秩表示的红外与可见光融合

红外和可见光图像融合是图像融合领域的一个重要问题,已在许多领域得到广泛应用。为了更好地保存源图像中的有用信息,提出一种简单有效的基于潜在低秩表示(LatLRR)的图像融合方法。首先,通过LatLRR将源图像分解为低秩部分(全局结构)和突出部分(局部结构)。然后,通过加权平均策略融合低秩部分,以保留更多轮廓信息。然后,通过求和策略简单地融合突出部分,这是该融合框架中的有效操作。最后,通过结合融合的低秩部分和融合的突出部分来获得融合图像。

2023-02-08 14:51:34 640 1

原创 An Infrared and Visible Image Fusion Architecture based on Nest Connection and Spatial/Channel Atten

在本文中,提出了一种用于红外和可见光图像融合的新方法,其中开发了基于嵌套连接的网络和空间/通道注意模型。基于嵌套连接的网络可以从多尺度的角度保存来自输入数据的大量信息。该方法包括三个关键要素:编码器、融合策略和解码器。提出的融合策略中,开发了空间注意模型和通道注意模型,描述了每个空间位置和每个具有深层特征的通道的重要性。首先,将源图像馈送到编码器中以提取多尺度深度特征。然后开发新颖的融合策略,以融合每个规模的这些特征。最后,融合图像由基于嵌套连接的解码器重建。结果表明,提出的方法比其他最先进的方法具有更好的

2023-02-08 14:47:37 325

原创 Infrared and visual image fusion through infrared feature extraction and visual information preserva

红外图像与视觉图像的理想融合应融合红外图像的重要亮点,并保留视觉图像的大量原始视觉信息。为此,本文提出了一种通过红外特征提取和视觉信息保存,简单、快速、有效的红外和视觉图像融合算法。首先,我们利用四树分解和Bézier插值来重建红外背景。其次,通过从红外图像中减去重建的背景来提取红外明亮特征,然后通过减少冗余背景信息进行细化。为了抑制过度曝光问题,对精细的红外特征进行自适应抑制,然后添加到视觉图像上,以实现最终的融合图像。

2023-02-08 14:42:34 239

原创 An infrared and visible image fusion method based on multi-scale transformation and norm optimizatio

本文提出了一种基于多尺度变换和范数优化的红外可见光图像融合新方法。该方法设计了具有对比度保真度(L2范数)和稀疏约束(L1范数)的新型损失函数,并利用拆分Bregman方法优化损失函数,得到预融合图像。通过使用多级分解潜在低秩表示(MDLatLRR)方法对预融合图像进行分解,得到最终的融合基础层。然后,以预融合图像为参考,引入图像结构相似度(SSIM)来评估可见光图像中细节信息的有效性,然后将结构相似度转换为权重图,应用基于L2范数的优化方法,生成最终的细节融合层。本文对所提出的方法进行了评估,并与18种最

2023-02-08 14:37:16 509 1

转载 基于深度学习的图像融合-论文整理【2022版】

图像融合技术旨在将不同源图像中的互补信息整合到单幅融合图像中以全面地表征成像场景并促进后续的视觉任务。近年来,随着深度学习的兴起,基于深度学习的图像融合算法如雨后春笋般涌现。特别是自编码器,生成对抗网络以及Transformer等技术的出现使图像融合性能产生了质的飞跃。然而,目前尚缺乏对不同融合任务场景下的前沿深度融合算法进行全面论述和分析的综述文献。为此,本文首先介绍图像融合的基本概念以及不同融合场景的定义。针对多模图像融合,数字摄影图像融合以及遥感影像融合等不同的融合场景,本文将从网络架构和监督范式等角

2022-10-13 18:39:20 3097

原创 [图像融合-论文笔记]A multiscale residual pyramid attention network for medical image fusion一种用于医学图像融合的多尺度残差金

将维数增加模块生成的特征图通过池化得到三个大小分别欸原始大小1/2,1/4,1/8倍的特征图。之后,使用残差注意力机制来获得每一层的输出特征,再对输出特征进行上采样,最后使用残差注意机制来获得最后一个特征图。金字塔注意力可以提取深层特征,但随着层数的增加,很容易丢失原始信息,因此将其结合互补,形成MSRPAN的新网络。因此,它具有两种网络的优点。特征提取器用于提取原始图像中的高维特征,特征融合器用于融合这些提取的特征。为了适应其他融合任务,需要手动的去增加或减少 MSRPAN 块的数量,以达到最好的效果。

2022-09-14 21:11:11 2251 1

原创 【图像融合-论文笔记】Fusion of multi-exposure images多曝光图像的融合

本文,以选定的图像的最佳曝光块为中心,使用单调递减的混合函数(混合函数将最大权重分配给块中心的像素,其他像素的权重与到块中心的距离成反比 ),将图像颜色与相应的混合函数值相乘。与此相识的算法有“Szeliski”,它从一组多重曝光图像中创建平均图像(平均图像像素是多重曝光图像对应位置像素的平均值),通过平均图像的直方图均衡过程(用于增加图像对比度,并补偿强度平均期间的对比度损失),将平均图像强度(以不改变平均强度的方式)映射到新强度。通过这种方法获得的图像块的组合图像,可能在块与块之间存在明显的不连续性。

2022-09-14 21:06:01 1317

原创 Multi-exposure image fusion via deep perceptual enhancement 通过深度感知增强实现多曝光图像融合

其中,DEM由两个编码器组成,其中一个称为联合编码器,接收两个源图像作为输入,旨在提取两个源图像之间的相关特征,而另一个对每个源图像进行单独编码,倾向于发现每个输入的代表信息,即判别编码器。为了训练 CEM 推断给定亮度的颜色,本文每个序列随机选择三个不同曝光度的图像,然后将选择的两个图像与第三个图像的亮度一起输入CEM。得益于色彩增强模块,即使原始图像由于过度曝光而缺乏色彩信息,本文的结果也具有更逼真和鲜艳的色彩,而竞争对手的结果可能会因为缺乏对颜色信息的具体处理,而遭受苍白或不真实的色彩问题。

2022-09-11 09:38:07 2887 2

Multi-exposure image fusion via deep perceptual enhancement

通过深度感知增强实现多曝光图像融合(译文)

2023-10-26

为新的教育数据治理引入技术、伦理、教育和社会结构

为新的教育数据治理引入技术、伦理、教育和社会结构

2023-09-07

聚脲材料性能对聚脲-钢复合板抗爆性影响机理的研究

聚脲材料性能对聚脲-钢复合板抗爆性影响机理的研究

2023-09-07

Ego-Body Pose Estimation via Ego-Head Pose Estimation译文

《通过自我-头部姿势估计进行自我-身体姿势估计》 摘要:从以自我为中心的视频序列中估计人类的三维运动在 理解人类行为方面起着关键作用,并在VR/AR中有着各 种应用。然而,天真地学习以自我为中心的视频和人类 运动之间的映射是具有挑战性的,因为用户的身体往往 无法被置于用户头部的前置摄像头所观察到。此外,收 集大规模、高质量的数据集,包括配对的以自我为中心 的视频和三维人体运动,需要精确的运动捕捉设备,而 这些设备往往将视频中的各种场景限制在类似实验室的 环境中。为了消除对成对的自我中心视频和人体运动的 需求,我们提出了一种新的方法,即通过自我-头部姿 势估计的自我身体姿势估计(EgoEgo),该方法将问 题分解为两个阶段,由头部运动作为中间代表来连接。 EgoEgo首先整合了SLAM和一种学习方法,以估计准确 †表示同等贡献。

2023-07-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除