计算机视觉
文章平均质量分 80
檀良月
一天不学习,浑身难受
展开
-
美颜技术---几种常用磨皮滤波器
美颜技术之几种常用磨皮滤波器原创 2022-07-08 17:22:30 · 1294 阅读 · 0 评论 -
美颜技术---色彩空间的认知
美颜技术之色彩空间的认知原创 2022-07-08 17:14:34 · 191 阅读 · 0 评论 -
Attention is all you need
Transformer 在transformer之前,RNN,LSTM,GRU已经在序列模型和翻译工作中建立了很多优秀的模型。transformer是第一个完全依赖于注意力去计算输入输出表示的模型,它没有用RNN,CNN。 注意力函数把query,key,value作为输入,再计算值的权重,然后计算值的权重和。 注意力函数普遍是用两种,分别是加法注意力和点乘注意力,他们两者效果取决于dkd_kdk 的大小。dkd_kdk 较小时候,两者效果差不多,dkd_kdk 较大时,加法机制优于原创 2021-09-10 17:12:29 · 92 阅读 · 0 评论 -
肺部图像分割
作业:肺部分割一、作业内容与要求采用机器视觉的方法对肺部图像进行分割,把肺部的主要区域分割出来。要求分析说明分割处理的方法,说明具体实施的每一个步骤,并编程实现(附上代码)分割算法,获得分割后的结果。二、肺部分割实现2.1 肺部分割实现过程步骤如图2-1所示2-1 肺部分割实现过程2.2 导入肺部图片用Opencv库中imread函数导入图像,并且用numpy做了图像通道转换,如图2-2所示2-2 图像导入2.3 图片二值化由于肺部与周围组织颜色对比明显,所以我考虑通过KMeans聚类原创 2021-09-04 18:50:14 · 3805 阅读 · 11 评论 -
KNN matting 与 Shared matting笔记
Knn Matting基于传播的抠图算法非局部原则(nonlocal principle)一个去噪 像素i 的期望值是由与它有类似特征像素与一个内核函数k(i,j)权重的加权和推导可以得到再转置相乘Lc 矩阵为聚类拉普拉斯算子算法步骤求解析解论文指出用户给出约束后,比如三分图,可以通过如下公式解出每个像素点的 alpha 值由于Lc的计算量比较大,作者选用 更加稀疏的 L 矩阵减少了计算量 ,L矩阵为拉普拉斯矩阵,其中m为用户标记像素的向量(前景,背景)(取原创 2021-07-06 17:42:55 · 1166 阅读 · 1 评论 -
Transformer引入CV的先河之作 ViT
Transformer引入CV的先河之作 ViTpaper : An image is worth 16x16 words: transformer for image recognition at scaleintroduction: 自注意力机制架构在NLP领域已经有了广泛的应用,并且一直有不错的结构,最近,也有部分研究者尝试在计算机视觉领域引入自注意力机制。 论文作者直接把一个标准的,没怎么修改过的 transformer 引入到图像领域,他们把图像分成 多个 补丁块,从而把他们当成序原创 2021-09-04 18:47:31 · 373 阅读 · 0 评论 -
Deformable Convolution Networks
Deformable Convolution Networks论文链接1.双线性插值原理由于可形变卷积在获取偏移位置像素点时候,需要用到双线性插值,所以我就把它先放到上面,并附上参考链接:参考链接线性插值线性插值是指插值函数为一次多项式的插值方式,其在插值节点上的插值误差为零。也就是连接两个已知量的直线来确定在这两个已知量之间的一个未知量的值的办法。转换为公式计算:双线性插值既然单个维度的线性插值误差较大,那么很自然的会想到从多维度的角度去减小误差,这就是双线性插值,其核心思想原创 2021-04-23 20:09:13 · 395 阅读 · 0 评论