自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 博客自建(带避坑指南)4:hexo文章页设置和动画魔改设置

咕咕了好久,这次终于来更新一下想必你已经完成了头像、图片等一些基础的设置,但是这些改动都是比较基础的,现在我们再进一步完善一下。

2024-08-14 11:04:01 807

原创 论文解读(17)- CityDreamer

本文认为一个3D城市生成应该包括两个部分:1)多样的建筑2)背景(包括道路、绿化等等)因此,从两个方面入手:instance-oriented和stuff-oriented然后文章还提出了数据集CityGen Datasets。(嘿,怎么abstract里没有具体说方法啊)

2024-08-07 16:55:46 651

原创 论文解读(16)-3D城市理解

目前对于3D模态的引入主要还是应用于室内和室外的活动(比如自动驾驶),因此3D辅助城市理解这块领域几乎是一片空白。所以就做了一个3D数据集和一种场景图增强的城市级理解方法(a Scene graph enhanced City-level Understanding method)尽量让输出在语义上接近真值最终用图来表示地理的特征。

2024-08-06 09:53:11 955

原创 论文解读(15)-UrbanGPT

目标是创建一个时空语言大模型,可以在城市任务中进行很好的泛化。

2024-08-05 09:52:27 1324

原创 论文解读(14)-GeoCLIP

首先指出了目前全球性的图像定位缺点,地球的地理分布具有多样性的特征,所以很难进行泛化。然后之前的方法是将地球进行切割,分成多个区域,然后按照分类问题进行考虑。但是GeoCLIP则是引入了GPS坐标,增强了定位的连续性。所以这是一个Image-to-GPS的算法。(这一段,有一点不是很懂随机傅里叶特征的作用,看文章后面有没有详细解释)

2024-08-02 08:45:04 1069

原创 论文解读(13)-StreetCLIP

本文的任务是Image geolocalization(图像地理定位)根据图像找地理坐标StreetCLIP是在CLIP上进行训练,可以在zero-shot中达到一个很好的效果。

2024-08-01 15:22:51 1056

原创 论文解读(12)-Transfer Learning

Transfer Learning就是迁移学习:因为标注数据是一项枯燥且花费巨大的任务,因此就要想办法进行废物利用。如何将一个数据集的数据可以应用于另一个新的任务,这就是迁移学习目标:将某个领域或任务上学习到的知识或模式应用到不同但相关的领域或问题中。

2024-08-01 09:43:10 412

原创 论文解读(11)-AddressCLIP

主要是如何根据图像,识别出位置分为两个步骤:1)预测地理坐标(geographical coordinate)2)转换为地址信息(human-readable address)

2024-07-31 16:01:39 1021

原创 论文解读(10)-图神经网络

加油,继续看论文。这次学图神经网络,这个概念经常在其他论文里出现,所以我想先学习一下这方面的知识。(视频4分钟)

2024-07-30 09:33:02 770

原创 论文解读(9)-Heterogeneity

数据异构(Data Heterogeneity)指的是在一个系统或数据集中存在多种类型、格式、结构或性质不同的数据。这些数据可能来自不同的数据源、具有不同的数据特点、表示方式、单位、精度等,因此在进行数据分析、处理和建模时需要考虑不同数据之间的异构性,例如需要进行数据转换、集成、规范化等操作。

2024-07-29 13:44:42 247

原创 论文解读(8)-ST-Norm

动态性就是一个物理量随时间演变的模式。假设这个物理量是x(t),那么动态性就可以理解为函数f(t) where。

2024-07-29 10:16:12 802

原创 博客自建(带避坑指南)3:简单的hexo网页界面设置

开始逐步探索hexo里的内容咯,冲冲冲!本文主要记录一下我使用到的一些技巧。

2024-07-26 14:09:39 1264

原创 论文解读(7)-CLIP

CLIP是OpenAI在2021年2月发表的一篇文章,其全称为,即一种基于对比文本-图像对的预训练方法。Text Encoder:用于将文本转换为低维向量表示-Embeding。Image Encoder:用于将图像转换为类似的向量表示-Embedding。CLIP在zero-shot learning的效果很好。

2024-07-24 15:39:40 993

原创 论文解读(6)-Transformer

其实,这个也谈不上论文解读,因为不是针对原Transformer论文,而是基于别人的理解上加入自己的解释。感觉想学这方面的论文,必须要知道一些基本的模型架构,所以补了一篇Transformer。

2024-07-24 11:18:17 899

原创 论文解读(5)-GeoHG

第一个是缺乏有效的特征表示第二个是因为区块间的依赖过于复杂geo-entity segmentation (地理实体分割)and point-of-interest(POI)integration用来捕获特征将空间的关联和社会环境属性统一到一个大的异构图里(heterogeneous graph),然后在高阶区域建立模型这样的模型还有一个非常重要的特点,支持在样本很小的情况下学习一个是区域内(intra-region features)

2024-07-23 15:17:09 818

原创 博客自建(带避坑指南)2:简单的界面主题设置

Hexo搭建个人博客,第二步,完成了主题的部署。

2024-07-23 11:12:18 1726

原创 论文解读(4)-UrbanCross

因为以前的卫星图像都是来自一个国家的,因此在不同国家之间不具有泛化能力,所以本文引入了一个包含了三个国家的新数据集。然后就是:SAM(一种分割模型) for visual augmentation首先介绍了目前对于卫星图像的基本处理方法,一个是content-based,直接用图像去生成标题,然后再对标题进行文字的对比,这个方法存在信息丢失。而像CLIP那种方法就可以很好的避免这样的情况。数据视角:利用卫星图中的地理标签对图像进行描述(不是用自己的文字描述)

2024-07-22 14:50:39 1007

原创 博客自建(带避坑指南)1:开始搭建环境

使用Hexo搭建Github个人主页里的博客,这是第一期!

2024-07-19 18:54:25 1044 2

原创 论文解读(3)-UrbanVLP

主要创新点在于结合了宏观(卫星)和微观(街景)的图像,并且引入了自动文本生成,提高了下游任务的可解释性,提高了文本描述的质量。顺便加强一下对上一篇文章的理解。现在主流的两种城市区域分析:1)这个是对特定任务的解决,归属下游任务2)这个目的是提高模型的综合性能,并没有一个具体的偏向,但是可以利用加强描述等方法,去让模型更好理解相关的输出,从而之后被应用到特定领域的时候有很好的发展空间。这个图左侧部分和上一篇论文有点像,主要就是介绍那两种城市区域分析方法。最后面是下游任务,可以先不用理他们。

2024-07-19 15:42:09 831

原创 论文解读(2)-UrbanCLIP

文本模态能否增强城市区域分析?如果能的话,那就具体是在哪些方面呢?UrbanCLIP是第一个将文本模态整合到城市图像的LLM增强框架思路是将卫星图像转化为文字,然后再用image-text pairs这种一对一对的方法去训练模型。右侧的就是论文中所提出的方法总的loss由上述的两个loss组成预测用MLP(多层感知机)完成所以可以理解为上述的所有操作都是对图像提供了一个加强理解,所有的loss计算都不涉及最后的指标,而最后将这个加强过滤后的结果扔进MLP里。

2024-07-19 13:50:04 1139

原创 论文解读(1)-城市多模态综述

**Deep Learning for Cross-Domain Data Fusion in Urban Computing: Taxonomy, Advances, and Outlook.**

2024-07-16 20:49:51 1232

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除