Rita_2017
码龄8年
求更新 关注
提问 私信
  • 博客:16,434
    16,434
    总访问量
  • 6
    原创
  • 5
    粉丝
  • 85
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
加入CSDN时间: 2017-09-28

个人简介:GPU编程 医学图像处理 编程语言学习

博客简介:

Rita_2017的博客

查看详细资料
个人成就
  • 获得6次点赞
  • 内容获得0次评论
  • 获得38次收藏
  • 博客总排名2,324,571名
创作历程
  • 2篇
    2022年
  • 1篇
    2020年
  • 1篇
    2018年
  • 2篇
    2017年
成就勋章
TA的专栏
  • CUDA编程
    4篇
  • 凸优化
    1篇

TA关注的专栏 1

TA关注的收藏夹 0

TA关注的社区 3

TA参与的活动 0

创作活动更多

新星杯·14天创作挑战营·第13期

这是一个以写作博客为目的的创作活动,旨在鼓励大学生博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。我们诚挚邀请你们参加为期14天的创作挑战赛!注: 1、参赛者可以进入活动群进行交流、互相鼓励与支持(开卷),虚竹哥会分享创作心得和涨粉心得,答疑及活动群请见:https://bbs.csdn.net/topics/619781944 【进活动群,得奖概率会更大,因为有辅导】 2、文章质量分查询:https://www.csdn.net/qc

89人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

Shared Memory,Warp和Bank Conflict

1. 概念Shared memory是片上存储器,因此与local memory或global memory相比更高的带宽和更低的延迟。前提是线程之间没有 bank conflicts。为了实现高带宽,共享内存被划分为大小相等的内存模块,称为Banks,可以同时访问。因此,任何由 n 个地址组成的内存读取或写入请求都可以同时提供服务,从而产生比单个模块带宽高 n 倍的总带宽。但是,如果内存请求的两个地址位于同一Bank中,则存在bank conflict,并且必须序列化访问。硬件........
原创
博文更新于 2024.10.24 ·
1161 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

C++时间与日期及相关操作

1. 概念(1) Coordinated Universal Time(UTC)协调世界时,又称世界标准时间,即格林威治标准时间(Greenwich Mean Time,GMT)。UTC 通用标准时,以z来标识,时间格式如下:2022-04-07T07:04:43.995Z北京时间为UTC+8,UTC时间转化为:2019-4-7 15:04:43(2)Calendar Time日历时间,是用"从一个标准时间点到此时的时间经过的秒......
原创
博文更新于 2023.08.02 ·
4793 阅读 ·
1 点赞 ·
0 评论 ·
13 收藏

CUDA实践(1)--性能分析工具

本文记录几种CUDA实践中常用的运行计时和性能分析工具。1. 运行计时虽然标准C语言也有相关计时方法,但是由于CPU与GPU之间的同步问题可能造成测时不准确,这里分别介绍这两种测试方法:(1)标准C语言计时函数C语言当前版本中包含一个头文件<time.h>,该文件中定义了一个时间变量clock_t,一个获取到目前为止的运行时间的函数clock(),以及一个将clock()函数结果转换为以秒为单位的常量CLOCK_PER_SEC。下面是一个简单的例子:clock_t star
原创
博文更新于 2020.09.02 ·
4132 阅读 ·
0 点赞 ·
0 评论 ·
11 收藏

CUDA并行编程学习心得1

(正在学习CUDA中, 写一些自己学习中的心得,如有错误,欢迎指正~) 对于普通变量(如int型,float型等), 不必在device端事先分配空间。在gloabl函数声明时,不要声明为指针,直接声明为int或float。gloabl函数调用时也是。 如果要在device端以指针形式使用这个变量,如下: float temp; float *dev_temp
原创
博文更新于 2020.08.28 ·
488 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

压缩感知与图像重建(1凸优化相关概念)

在正题之前,首先明确几个相关概念:(1)凸集(convex set):集合C内任意两点的连线都在集合C内。                   (2)凸函数(convex function):                 如:(3)Lp范数:                             (4) L0范数: 一个向量的L0范数等于该向量中非零元素的个数,即:             ...
原创
博文更新于 2018.06.20 ·
4949 阅读 ·
5 点赞 ·
0 评论 ·
13 收藏

CUDA并行编程学习心得2

(正在学习CUDA中, 写一些自己学习中的心得,如有错误,欢迎指正~)P     在一个__global__函数调用__device__函数的程序中, 编译时出现错误,如下:      C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V110\BuildCustomizations\CUDA 8.0.targets(687,9):
原创
博文更新于 2017.11.07 ·
734 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏