快乐读博-CSDN博客

原创 TOPO-DataGen 工作流程

对于每种景观，我们提供了三个场景的数据：LHS-sim、In-place和Out-of-place，所有这些场景都附带合成2D图像、多模态3D标签和语义地图，如图2所示。更多误差分析可以在补充材料中找到。来自国家机构的高质量开放地理数据越来越普遍，也更容易获得感兴趣区域的3D模型，并使用我们的方法来进行虚拟数据的合成。我们的工作流程在真实世界和虚拟世界之间无缝遍历，以相机姿势为条件：从最左边的真实地理标记的照片中，我们可以生成一组丰富的匹配合成模式，包括合成 RGB 图像、场景坐标、深度、表面法线和语义。

2024-06-20 13:42:10 705

原创通用域自适应（Universal Domian Adaptation）

在UDA中，给定一个标记的源领域，对于任何相关的目标领域，无论其标签集与源领域的标签集有何不同，如果目标领域的样本属于源标签集中的任何一类，我们都需要正确分类它，否则将其标记为“未知”。然而，在通用领域适应中，这种直接的方法可能会失效，因为由于潜在的领域差异，神经网络的预测往往过于自信[10]但区分度较低。（3）我们提出了通用适应网络（UAN），这是一种端到端的解决方案，它利用每个样本的领域相似性和预测不确定性来开发一种加权机制，以发现两个域共享的标签集并促进共同类别的适应。

2024-05-25 17:22:41 1134

原创 Domain Adaptation(领域自适应)

我们可以训练一个在source domain 上难免表现很出色的模型，但是当target domian和source domain的数据分布不一样时候，我们之前在source domian上面训练的模型，在target domain上面表现可能不是很好。其中绿色长方形的代表我们从source domain和target domain提取的特征图（特征向量），我们要求来自两张图片（source domain 和target domain）出现的数据点（红色点和蓝色点）分布应该看起来一样，分不出差异。

2024-05-25 11:16:24 677

原创 TransGeo（论文阅读）

论文大概：本文充分利用了transformer的全局信息建模和显著位置编码优势，并利用注意力引导的非均匀编码技术对图像的无用信息进行了去除，保留了有用信息，进而可以使多余的计算成本用于计算高分辨率的图像，实验表明，我们在城市和农村的数据集上都达到了sota水准。代码：https: //github.com/Jeff-Zilence/TransGeo2022.由于本人之前已经读过这篇论文，因此下面直接开始代码实战。

2024-05-22 23:50:56 136 1

原创基于语义和几何感知图像定位的领域自适应

图像检索定位是解决这个问题的一种高效有效的方法。自从深度卷积神经网络（DCNN）提高了视觉感知的性能，大量研究在单目深度估计[18]，[19]，[29]，[30]以及语义分割[21]，[31]，[32]方面取得了有希望的结果，其中全卷积神经网络（FCNNs）被引入以实现端到端的训练。对于深度预测任务[43]-[45]和语义分割[46], [47]中的领域自适应，大量工作专注于图像翻译[43], [45]，这在很大程度上依赖于翻译性能[48]并且难以涵盖所有变化的环境，因此它们不适合在各种条件下的地点识别。

2024-05-18 19:32:15 122

原创语义图像检索

检索过程：提取输入的ROI区域的resnet101的cnn特征，该描述符经过分类器识别概念节点，然后返回初始的概念集，这些概念集会出现在查询区域当中，然后用户通过在线交互修改初始返回的概念列表。最后，使用CBIR（基于内容的图像检索）根据相似度对检测到的子节点所属的图像进行排序，以形成检索结果，流程如图2所示。我们的方法包含多个步骤：使用高级语义分割进行ROI区域的提取，使用CNN描述符进行ROI的表示，高效的数据库组织形式，查询区域中的概念（节点）和子节点，使用CBIR检测子节点的排名。

2024-05-18 12:04:54 550

原创 SFD2：代码实战（登录文章给出的github下载代码）

SFD2：代码实战（登录文章给出的github下载代码）

2024-05-13 00:14:24 998 1

原创语义引导的特征检测和描述

视觉定位在自动驾驶和机器人领域的基础任务。过去的工作只在提取大量丰富的局部可靠特征，然而在具有挑战性的大范围环境中，局部特征的有效性和准确性会受到限制。与之前的工作不同，我们提出来一种通过隐式地讲语义信息编码到特征检测和描述过程中的全局可靠特征提取方法。具体而言：我们的语义感知检测器能够从可靠区域（如建筑物、交通车道）中检测图像关键点，并隐式抑制不可靠区域（如天空、车辆等），而不是依赖于显式的语义标签。我们的方法通过减少对外观变化敏感的特征数量和避免在测试过程中需要额外的语义分割网络提高了关键点匹配的准确率

2024-05-11 12:23:30 294 1

weixin_63778889的博客