图形图像
文章平均质量分 93
xieyan0811
算法工程师,终生学习者,《Python大数据与机器学习实战》作者
展开
-
Sora原理浅析
大家都想看看 Sora 的原理。因为 OPENAI 并没有公开技术细节,有些具体方法我们只好脑补一下。原创 2024-02-22 10:58:53 · 1281 阅读 · 0 评论 -
论文阅读_胶囊网络CapsNet
胶囊是一组神经元,其激活向量能表示特定类型的特征,比如一个对象或对象部分。文中用激活向量的长度表示存在的概率,用方向表示参数。原创 2022-07-31 17:01:59 · 744 阅读 · 1 评论 -
TorchVision
说明很多基于Pytorch的工具集都非常好用,比如处理自然语言的torchtext,处理音频的torchaudio,以及处理图像视频的torchvision。torchvision包含一些常用的数据集、模型、转换函数等等。当前版本0.5.0包括图片分类、语义切分、目标识别、实例分割、关键点检测、视频分类等工具,它将mask-rcnn功能也都包含在内了。mask-rcnn的Pytorch版本最高支持torchvision 0.2.*,0.3.0之后mask-rcnn就包含到tensorvision之中原创 2020-06-04 13:54:34 · 1377 阅读 · 0 评论 -
残差网络ResNet代码解读
残差网络效果卷积神经网络CNN的发展历史如图所示:从起初AlexNet的的8层网络,到ResNet的152层网络,层数逐步增加。当网络层数增加到一定程度之后,错误率反而上升,其原因是层数太多梯度下降变得越发困难。而ResNet解决了这一问题。目前ResNet是应用最广的图像相关深度学习网络,图像分类,目标检测,图片分割都使用该网络结构作为基础,另外,一些迁移学习也使用ResNet训...原创 2019-11-25 09:30:09 · 4354 阅读 · 0 评论 -
怎么看目标检测的效果
Recall&Precision 引用一个知乎上的例子:某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下:正确率 Precision = 700 / (700 + 200 + 100) = 70% 召回率 Recall = 700 / 1400 = 50% (出处:https://www.zhihu.com/question/19645541/answer/39732647) IoU:预...原创 2020-05-12 08:27:01 · 1063 阅读 · 0 评论 -
图像处理之_ARToolKit自定义Marker
1. 制作marker ARToolKit支持两种标记,一种是黑白图,另一种是普通图。 黑白图使用工具mk_patt制作,它有一些硬性的规定,比如必须是黑白图,正方形,且有边框等等。 普通图更灵活,它可以是我们生活中的图像,比如公交卡,身份证等等,但相对黑白图,不那么容易识别,其原理主要是根据图片上的边缘,识别其中的一些点,把这些点之间的关系保存下来,并在摄像机图片中寻找对应的关系,以实现...原创 2019-01-20 17:31:21 · 1353 阅读 · 0 评论 -
Pytorch提取不同层次图片的特征
下例使用torchvision库提取了resnet最后一层的卷积特征;resnet各block的卷积特性,以及金字塔特性。具体取哪一层特征视使用场景而定,resnet各block的输出包含更丰富的特征;从resnet最后一层提取的特征更为抽象;fpn每层通道数相等,含义也类似,可以在多层之间比较。import osimport torchvision.models.detection.backbone_utils as backbone_utilsimport torchvisionimpo原创 2020-05-21 11:20:19 · 1842 阅读 · 0 评论 -
Python人脸识别
“人脸识别”是人工智能的一个重要应用,听起来技术含量很高,貌似非常复杂,具体的实现也的确非常复杂,目前的算法一般都基于深度学习神经网络。但如果仅仅是使用识别功能,目前已有封装好的功能模块,并不需要训练模型,甚至不需要了解任何算法原理,只需调用Python的三方模块,几行代码即可实现人脸识别。 face_recognition是目前使用方法最简单,效果也非常好的人脸识别库,它的离线识别率高达9...原创 2019-08-08 18:14:22 · 1155 阅读 · 0 评论 -
迁移学习之_猫狗大战
1. 迁移学习 迁移学习(transfer learning)是指将已经学习的知识应用到其它领域,在图像识别问题中,是将训练好的模型通过简单调整来解决新的问题。从图像中提取特征,不一定需要算力强大的GPU,训练上百层的神经网络。 卷积神经网络中卷积层和池化层可以抽取图片的几何特征,比如浅层的卷积用于抽取出一些直线,角点等简单的抽象信息,深层的卷积层用于抽取人脸等复杂的抽象信息,最后的全连接...原创 2019-02-08 13:15:50 · 1456 阅读 · 1 评论 -
图片分割之_训练模型和预测
1. 说明 本篇使用Mask R-CNN算法,以及十几张从网络上下载的香蕉图片,训练一个模型。用于识别图像中的香蕉,不同于苹果,桔子,香蕉从不同的角度看差异很大,尤其是三五根香蕉放连在一起,或者整把香蕉的形态和单根香蕉差异很大。可以算是一种识别起来相对困难的水平。 下图是用训练好的模型识别出的香蕉图片,可以看到,基本识别正确。 操作步骤可分为:安装工具,标注图片,修改源码,模型训练...原创 2019-02-03 08:26:59 · 1823 阅读 · 0 评论 -
常用的色板
1. 说明 有时候需要从图像中判断某种颜色,或者获取某个颜色区域,此时常用HSV色板判断。因为在HSV的色彩空间中,只需要判断颜色通道即可。本篇介绍HSV色板,及其在python中的转换和使用方法。2. 色板(1) RGB 三个通道,红色Red, 绿色Green, 蓝色Blue,值越大颜色越大,当三个值都大时为白色,三个值都为0时为黑色。(1) HSV 三个通道,HSV(H...原创 2019-01-27 20:53:00 · 1990 阅读 · 0 评论 -
图像处理之_霍夫(Hough)变换
Hough变换是一种在图像中寻找直线,圆及其它简单形状的方法.当我们对图像进行边缘检测之后,可用Hough变换识别图像中的简单形状.该转换也是对图像的一种抽象(由繁到简).下面介绍最基本Hough变换:寻找直线算法.原创 2017-04-28 08:02:02 · 1769 阅读 · 0 评论 -
图像处理之_聚焦效果LogPolar
LogPolar是将笛卡尔坐标到对数极坐标的变换.即:将 (x,y) 映射到 (log(ρ),θ)原创 2017-05-03 08:35:05 · 1800 阅读 · 0 评论 -
图像处理之_仿射变换与透视变换
1. 仿射变换1) 用途旋转 (线性变换),平移 (向量加).缩放(线性变换),错切,反转2) 方法仿射变换是一种二维坐标到二维坐标之间的线性变换,它保持了二维图形的“平直性”(直线经过变换之后依然是直线)和“平行性”(二维图形之间的相对位置关系保持不变,平行线依然是平行线,且直线上点的位置顺序不变)。任意的仿射变换都能表示原创 2017-05-03 08:42:31 · 16198 阅读 · 2 评论 -
图像处理之_傅立叶变换
将一幅图像从其空间域(spatialdomain)转换为频域(frequencydomain)。图像处理用到的主要是离散傅立叶变换(Discrete Fourier Transform),下文中简称DFT。原创 2017-05-09 13:03:26 · 4431 阅读 · 0 评论 -
图像处理之_轮廓匹配
上学那会儿,我们同学说“学这微积分有什么啊,我去买菜还积个分呢?”N年之后终于用上了。原创 2017-05-09 13:12:50 · 13049 阅读 · 0 评论 -
图像处理之_卡尔曼滤波
用途: 根据一些已知的量来预测未知的量。常用于运动预测。原创 2017-05-19 14:01:28 · 16319 阅读 · 1 评论 -
图像处理之_OpenCV入门
1. 带着问题看OpenCV 1) 实现了哪些功能,如何调用?OpenCV实现了图像处理(类似PhotoShop),校正,分割前景背景,视频监控,运动跟踪,人脸识别,手势识别等功能,并支持机器学习算法。和很多开源工具一样,它提供的是很基础的功能。程序开发者利用基本函数的组合,适配场景,实现具体功能。它本身只是一个工具集,不是具体问题的解决方案。原创 2017-06-01 17:47:02 · 741 阅读 · 0 评论 -
图像处理之_增强现实工具ARToolKit
1. 增强现实 增强现实(AR)是将电脑虚拟的图像覆盖到真实世界画面中,这个技术在工业和理论研究方面都存在着极大的潜能。2. 相关概念(1) ARToolkit ARToolkit,是一个开源的AR(增强现实)SDK。它是用C/C++ 语言编写的库,通过它可以很容易地编写增强现实应用程序。 增强现实中最困难的部分在于实时的将虚拟图像覆盖到用户视口,并且和真实世界中的对象精确对齐。A...原创 2018-12-16 20:45:37 · 3328 阅读 · 0 评论 -
图像处理之_导数微分
导数微分在图形图像处理中的应用原创 2017-04-28 07:55:45 · 12875 阅读 · 0 评论