自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 半监督:FixMatch

pt2output1output2​1/Ttargetsuptsumdim1pt​GPT总结:FixMatch 是一种用于半监督学习的方法,它结合了伪标签生成和一致性正则化来有效利用无标签数据。

2024-07-24 13:46:10 853

原创 etc/apt/source.list文件 与 etc/apt/source.list.d/目录

source.list.d是一个文件夹,通常存储的是第三方镜像信息,里面放有各种以.list结尾的文件,每个.list结尾的文件存储一个类型的镜像信息。例如:google-chrome.list中存储chrome相关的镜像信息。source.list文件中直接存储镜像信息,保存了ubuntu软件更新的源服务器的地址.apt-get命令就是从两个文件/目录中找到镜像后进行下载的。标题的两个文件/目录是linux存储镜像信息的两种方式。

2024-06-17 14:58:24 111

原创 解决Python中的OSError: [Errno 24] Too many open files问题

错误原因:同时打开太多文件,linux操作系统有对单个进程可以打开的文件描述符数量的限制。当程序打开的文件数量超过这个限制时,就会触发这个错误。参考:https://cloud.baidu.com/article/3269701。可能是代码打开文件后忘记关闭,导致同时打开太多文件。

2024-06-14 16:05:08 196

原创 transforms中totensor应该放在哪里?

在transforms.resize()等之后,transforms.normalize()之前。

2024-06-13 15:15:10 376

原创 torch.where()

返回为一个元祖,元祖第0项,第1项相应位置的组合即为满足条件的元素的索引,上例中有[0,0],[1,2],[2,0],[2,1]torch.where(condition)返回满足condition的数组的索引。除开网上常见的where用法。

2024-06-06 17:05:57 212

原创 模型评估:ROC曲线和AUC值

在将ROC和AUC之前,先讲前置知识。

2024-05-13 18:41:46 820 1

原创 如何实现图片某一channel的值加x,且不溢出255

这样img_yuv[:, :, 0] + add_num的值可能会溢出255而变为0,1等值,因为cv2读image返回类型为uint8的ndarray。正确的做法为,先将ndarray类型转换为uint16或其他,再进行处理,最后再转回uint8。

2024-05-08 17:55:43 149

原创 YCrCb,HSV色彩空间

YCrCb色彩空间类似YUV色彩空间,Y代表光源的亮度,色度信息保存在Cr和Cb中,其中,Cr表示红色分量信息,Cb表示蓝色分量信息。YUV色彩空间见博文:https://blog.csdn.net/czlczl20020925/article/details/138534395?

2024-05-07 17:25:27 228

原创 直方图均衡化

参考:https://cloud.tencent.com/developer/article/1667213。

2024-05-07 16:52:51 204

原创 YUV色彩空间

YUV为一种图像编码格式。

2024-05-07 15:57:41 630

原创 ShuffleNet理论

ShuffleNetV1亮点提出channel shuffle思想,解决组卷积中各组channel之间信息没有交流的问题,如下图a为原组卷积,b和c为添加channelshuffle的组卷积将MobileNet中的PW卷积改为group卷积,因为作者发现MobileNet中PW卷积最耗时间,见下图a为MobileNet中的bneck,b和c分别为ShuffleNet中步距为1和2的模块ShuffleNetV1结构:ShuffleNetV2影响网络效率的四个因素输入输出channel

2024-05-07 11:45:16 386

原创 MobileNet模型实现

【代码】MobileNet模型实现。

2024-05-06 16:16:34 158

原创 MobileNet理论

参考:https://blog.csdn.net/flyfish1986/article/details/97017017。

2024-05-03 16:39:09 587

原创 卷积种类和计算FLOPs(计算量)

(未用到)

2024-05-03 13:01:48 311

原创 滤波处理总结(双边滤波,引导滤波)

注意上式计算出ak,bk后还不能得到输出图像O,因为ak,bk为每个滤波核(区域)对应的ab参数,而某一个像素点可能属于多个区域,因此需要将ak,bk转变为ai,bi,即每个像素点对应的ab参数。双边滤波能够根据像素值来权衡其权重,若某像素值与当前处理像素的值差别较大,则该像素权重较低,因此可以很好地保留高频区域的信息(高频区域周围像素值差别较大,不应简单的平均化处理)推导过程O为输出图像,I为输入图像,n为噪声,i为像素点,wk为局部区域(滤波核区域)最终Oi=ai*Ii+bi。

2024-04-30 15:13:06 119 1

原创 Retinex(SSR,MSR,MSRCR)

各参数的含义及取值还没完全搞懂。

2024-04-26 13:48:46 822

原创 docker基本操作

镜像和容器操作docker run和docker start区别:docker run是创建并启动容器;docker start是启动容器docker save:保存镜像为本地压缩包docker load:从本地压缩包加载镜像docker build:创建镜像到本地docker images:查看本地镜像docker ps:查看容器状态docker logs:查看容器运行日志docker exec:通过运行命令进入容器内部数据卷操作数据卷挂载方式一数据卷挂载必须在dock

2024-04-24 17:51:27 194 3

原创 ResNet网络结构与训练

ResNet网络结构当主分支输出channel与shortcut输出channel不一致时用虚线结构18和34层ResNet的残差结构第一种残差结构(实线结构)第二种残差结构(虚线结构)50,101,152层ResNet的残差结构第一种残差结构第二种残差结构第三种残差结构仅在conv2_x的第一个残差结构中使用,仅改变channel,不改变size网络层次结构(conv1[112*112*3]表示conv1层输出格式为112*112*3)18,34层ResNet与5

2024-04-23 18:08:38 417

原创 卷积操作中的数量关系

卷积操作中的数量关系每个卷积核都有channel和width(=height)卷积操作中,卷积核的channel数=输入特征矩阵的channel数卷积操作中,输出矩阵的channel数等于卷积核的个数

2024-04-22 18:11:39 319

原创 pytorch中矩阵拼接操作(torch.cat)

【代码】pytorch中矩阵拼接操作(torch.cat)

2024-04-22 17:40:26 195

原创 使用GPU进行模型训练和预测的两种方式

【代码】使用GPU进行模型训练和预测的两种方式。

2024-04-22 17:13:58 314

原创 GoogLeNet池化操作的尺寸计算问题

问题描述池化操作后尺寸=(原尺寸-kernel_size+2*padding)/stride+1GoogLeNet中maxpool1和maxpool2计算出的池化后尺寸均进行了向上取整,原因分析:这里猜测的原因是ceilmode=True导致池化操作可能在越界时添加了padding

2024-04-22 15:38:00 137

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除