- 博客(5)
- 资源 (8)
- 收藏
- 关注
原创 图像颜色迁移专题介绍(二): Correspondence
正如上一篇博客Global Color Transfer所介绍的那样,直接建立图片到图片的全局颜色迁移,可能会出现各种映射异常。在没有考虑到语义对应的情况下,建立的颜色迁移往往不能满足要求。一个非常容易想到的改善方案,就是建立图片的语义对应区域,并根据这些对应区域提供的约束,重新设计颜色映射函数,使得在颜色迁移后,语义关联的区域能够有更准确的结果。因此,在全局颜色映射提出后的相当一段时间,研究者的重点就放在了怎样找到图片中语义的对应关系上。
2021-11-27 20:10:54 3640 1
原创 图像颜色迁移专题介绍(一): Global Color Transfer
最近因为种种工作的要求,需要我在视觉领域找一个题目做一做。我决定重操旧业,把我硕士阶段曾经研究过一小段时间的图像颜色迁移重新拾起来,看一下有什么可以做的东西。本篇博客就是我最近做算法调研时候的一些思路的分享,希望给那些做类似研究的同学提供一点帮助。
2021-11-18 19:55:36 5591 4
原创 CUDA编程系统性学习笔记(三):存储优化
对于GPU并行编程稍有了解的同学,应该知道存储优化是多么重要。减少主机端到设备端的数据传输次数,调用具有合适权限的不同种类的存储,优化数据结构与算法在存储中执行,直接决定了并行的效率。本章我们就来谈下如何针对存储的使用进行优化,来提升并行编程的效率。1. 端到端的数据传输最小化Host-Device之间的数据传输速度远低于global memory,因此需要减少数据传输的频率。一些基本的优化原则包括:中间数据直接在GPU分配,操作和释放;GPU更适合重复计算。如果数据传输没有减少,性能提升有
2021-11-04 19:35:29 774
原创 CUDA编程系统性学习笔记(二):基本优化
1. Shared Memory可以知道的是,我们在GPU中执行Cuda线程程序中,应该尽可能减少从Global Memory中进行访存操作。原因是,这会大大降低线程执行的效率。Global Memory数据是存储在公共显存中,但是每一个线程是在一个SP单元中执行,从公共显存到执行单元,这样数据的传输效率会比较低。如果在Block内的共有空间访问数据,即在Shared Memory中读取数据,就会快很多。因此,CUDA编程优化的一个重要点,就是要利用Shared Memory来在访存上提升效率。以矩
2021-11-03 19:14:55 304
原创 CUDA编程系统性学习笔记(一):存储,函数与线程概念
持续关注我的朋友可能知道,之前因为做一个点云配准的项目,重新又开始学习CUDA编程。以我浅薄的并行编程技术,对于一些对存储要求不是很高的小程序,还勉强能够应付。但是最近做的一个网格优化的并行项目,数据量大,动态存储要求高,对存储空间数据的更新频率频繁,自然对并行编程的存储使用有了更高的要求。因此,为了能够更进一步的提升并行编程技术,解决存储使用的一些问题,我最近学些了英伟达周斌老师的视频教程,做一个系统性的学习与提升。本篇博客分享一些我在并行编程中存储使用的一些心得体会,作为备忘,同时分享给大家。1.
2021-11-03 18:05:37 219
基于Face++SDK的人脸特征点定位项目(VS2017)
2018-12-04
百度自然语言处理项目(VS2017)
2018-12-04
语义理解项目( VS2017+灵云NLU语义理解项目)
2018-11-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人