2021年11月_程序猿老甘

12月 11月 10月 09月 08月 07月 06月 04月 03月 02月

原创图像颜色迁移专题介绍(二): Correspondence

正如上一篇博客Global Color Transfer所介绍的那样，直接建立图片到图片的全局颜色迁移，可能会出现各种映射异常。在没有考虑到语义对应的情况下，建立的颜色迁移往往不能满足要求。一个非常容易想到的改善方案，就是建立图片的语义对应区域，并根据这些对应区域提供的约束，重新设计颜色映射函数，使得在颜色迁移后，语义关联的区域能够有更准确的结果。因此，在全局颜色映射提出后的相当一段时间，研究者的重点就放在了怎样找到图片中语义的对应关系上。

2021-11-27 20:10:54 3640 1

原创图像颜色迁移专题介绍(一): Global Color Transfer

最近因为种种工作的要求，需要我在视觉领域找一个题目做一做。我决定重操旧业，把我硕士阶段曾经研究过一小段时间的图像颜色迁移重新拾起来，看一下有什么可以做的东西。本篇博客就是我最近做算法调研时候的一些思路的分享，希望给那些做类似研究的同学提供一点帮助。

2021-11-18 19:55:36 5591 4

原创 CUDA编程系统性学习笔记(三)：存储优化

对于GPU并行编程稍有了解的同学，应该知道存储优化是多么重要。减少主机端到设备端的数据传输次数，调用具有合适权限的不同种类的存储，优化数据结构与算法在存储中执行，直接决定了并行的效率。本章我们就来谈下如何针对存储的使用进行优化，来提升并行编程的效率。1. 端到端的数据传输最小化Host-Device之间的数据传输速度远低于global memory，因此需要减少数据传输的频率。一些基本的优化原则包括：中间数据直接在GPU分配，操作和释放；GPU更适合重复计算。如果数据传输没有减少，性能提升有

2021-11-04 19:35:29 774

原创 CUDA编程系统性学习笔记(二)：基本优化

1. Shared Memory可以知道的是，我们在GPU中执行Cuda线程程序中，应该尽可能减少从Global Memory中进行访存操作。原因是，这会大大降低线程执行的效率。Global Memory数据是存储在公共显存中，但是每一个线程是在一个SP单元中执行，从公共显存到执行单元，这样数据的传输效率会比较低。如果在Block内的共有空间访问数据,即在Shared Memory中读取数据，就会快很多。因此，CUDA编程优化的一个重要点，就是要利用Shared Memory来在访存上提升效率。以矩

2021-11-03 19:14:55 304

原创 CUDA编程系统性学习笔记(一)：存储，函数与线程概念

持续关注我的朋友可能知道，之前因为做一个点云配准的项目，重新又开始学习CUDA编程。以我浅薄的并行编程技术，对于一些对存储要求不是很高的小程序，还勉强能够应付。但是最近做的一个网格优化的并行项目，数据量大，动态存储要求高，对存储空间数据的更新频率频繁，自然对并行编程的存储使用有了更高的要求。因此，为了能够更进一步的提升并行编程技术，解决存储使用的一些问题，我最近学些了英伟达周斌老师的视频教程，做一个系统性的学习与提升。本篇博客分享一些我在并行编程中存储使用的一些心得体会，作为备忘，同时分享给大家。1.

2021-11-03 18:05:37 219

基于有道智云的英文词汇分析程序.rar

基于有道智云的英文词汇分析程序，实现对词汇文件的翻译，并输出词汇的原型形式。

2019-09-11

基于Face++SDK的人脸特征点定位项目（VS2017）

基于Face++的SDK，实现的人脸特征点定位工具。重写了源文件中的一些json解析代码和命令请求代码。可以实现83点与106点探测的切换。返回数据存储在一个vector中，使用opencv显示程序就可以看到。使用前需要在Face++官网上注册账户并配置应用，将相应的APPID和密码写到main函数里的对应位置就可以。

2018-12-04