图像处理
文章平均质量分 79
无崖子0
经理说,这小伙子不错
展开
-
BSP-Net: Generating Compact Meshes via Binary Space Partitioning精讲
在近日举行的 CVPR 2020 大会上,最佳论文、最佳学生论文等奖项悉数公布。加拿大西蒙弗雷泽大学陈之钦(Zhiqin Chen )等人的「BSP-Net」相关研究获得了最佳学生论文奖,他们的论文题目是《BSP-Net: Generating Compact Meshes via Binary Space Partitioning》。在最新一期的机器之心 CVPR 2020 线上论文分享中,西蒙弗雷泽大学 (SFU) 博士一年级学生陈之钦以第一作者的身份向我们分享了这篇最佳学生论文。在这项研究中,.原创 2020-12-28 19:03:02 · 838 阅读 · 0 评论 -
BSP-Net:通过二进制空间划分生成紧凑网格
我们介绍了BSP-Net,它是一种通过二进制空间划分生成紧凑网格的网络。我们生成的网格是低多边形的,并保证是紧密的。边缘可以重现清晰的细节,但仍可以近似弯曲的边界。视频链接:https://youtu.be/9-ixexpjN-8?t=2我们的BSP-Net生成紧凑的低多边形网格。输出可以再现锐利的边缘和近似平滑的几何形状。诸如IM-NET之类的隐式模型需要等值曲面,从而导致网格过于网格化,而网格只能近似具有平滑表面的清晰细节。我们的关键思想源自二进制空间分区树(BSP)。如左..原创 2020-12-28 19:01:09 · 1346 阅读 · 0 评论 -
神经网络模型(Backbone)--从AlextNet讲起
自己搭建神经网络时,一般都采用已有的网络模型,在其基础上进行修改。从2012年的AlexNet出现,如今已经出现许多优秀的网络模型,如下图所示。 主要有三个发展方向:Deeper:网络层数更深,代表网络VggNetModule: 采用模块化的网络结构(Inception),代表网络GoogleNetFaster: 轻量级网络模型,适合于移动端设备,代表网络MobileNet和ShuffleNetFunctional: 功能型网络,针对特定使用场景而发展出来。如检测模型YOLO,Faster R原创 2020-07-23 15:57:24 · 2006 阅读 · 0 评论 -
手把手教你从零搭建深度学习项目(附链接)
简介:在学习了有关深度学习的理论之后,很多人都会有兴趣尝试构建一个属于自己的项目。本文将会从第一步开始,告诉你如何解决项目开发中会遇到的各类问题。本文由六大部分组成,涵盖深度学习 ( DL ) 项目的整个过程。我们将使用一个自动漫画着色项目来说明深度学习的设计、程序调试和参数调整过程。第一部分:启动一个深度学习项目1. 应该选择什么样的项目?很多人工智能项目其实并没有那么严肃,做起来还很有趣。2017 年初,我着手启动了一个为日本漫画上色的项目,并作为我对生成对抗网络 ( GAN ) 研究的一.原创 2020-07-14 14:26:05 · 4864 阅读 · 2 评论 -
3D点云深度学习」综述论文--Deep Learning for 3D Point Clouds: A Survey
三维点云深度学习研究综述论文:Deep Learning for 3D Point Clouds: A Survey作者:Yulan Guo时间:2019-12引言动机:Point cloud learning(点云学习)由于在视觉、自动驾驶、机器人等方面的广泛应用,近年来受到了广泛的关注。最近,随着点云的深度学习变得更加兴旺,人们提出了许多方法来解决这一领域的不同问题。为了促进未来的研究,本文对点云深度学习方法的最新进展进行了全面的综述。挑战:深度学习技术目前已经成为成功解决各种二原创 2020-06-26 21:52:35 · 8769 阅读 · 2 评论 -
CNN中难点分析--对卷积层(Convolution)与池化层(Pooling)的理解
传统机器学习通过特征工程提取特征,作为Input参数进行输入,从而拟合一个相对合适的w参数,而CNN利用卷积层感知局部特征,然后更高层次对局部进行综合操作,从而得到全局信息,池化层层提取主要特征,从而自动提取特征。1、池化层的理解pooling池化的作用则体现在降采样:保留显著特征、降低特征维度,增大kernel的感受野。另外一点值得注意:pooling也可以提供一些旋转不变性。池化层可对提取到的特征信息进行降维,一方面使特征图变小,简化网络计算复杂度并在一定程度上避免过拟合的出现;一方面进行特征压.原创 2020-06-01 22:53:44 · 12957 阅读 · 0 评论 -
机器学习常用的向量距离度量准则
原创 2020-06-01 22:19:07 · 560 阅读 · 0 评论 -
目标检测的图像特征提取之LBP特征
LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen,和 D. Harwood 在1994年提出,用于纹理特征提取。而且,提取的特征是图像的局部的纹理特征;1、LBP特征的描述原始的LBP算子定义为在33的窗口内,以窗口中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,33邻域内的8原创 2020-05-31 18:12:42 · 5943 阅读 · 0 评论 -
迁移学习的几种迁移方式
迁移学习是当前深度学习领域的一系列通用的解决方案,而不是一个具体的算法模型。Pre-training + fine-tuning(预训练+调参) 的迁移学习方式是现在深度学习中一个非常流行的迁移学习方式,尤其是以图像领域为代表,很多时候会选择预训练的 ImageNet对模型进行初始化。在迁移学习中,有几个概念,domain(域)和task(任务) 、source(源) 和target(目标)需要理清楚。- domain:一般指的是特征空间和概率分布 - task:包含标记空间和目标预测函数- sour原创 2020-05-28 22:20:49 · 18056 阅读 · 3 评论 -
NLP领域中的迁移学习现状
本文拓展自NAACL 2019教程“NLP领域的迁移学习”,这个教程是由Matthew Peters、Swabha Swayamdipta、Thomas Wolf和我组织策划的。在这篇文章中,我强调了一些在这个领域中的见解和收获,并根据最近的工作进展更新了一部分资料。整篇文章的结构如下图。图1一、内容简介我们在这篇文章中的对迁移学习的主要定义如图所示,迁移学习是一种从源设置中提取信息并将其应用于不同设定目标的方法。图2:迁移学习过程的说明在过去一年多的时间里,以预训练的语言模型形式进行的迁移学原创 2020-05-28 21:53:43 · 1546 阅读 · 0 评论 -
卷积神经网络--图像卷积与反卷积(后卷积,转置卷积)
1.前言传统的CNN网络只能给出图像的LABLE,但是在很多情况下需要对识别的物体进行分割实现end to end,然后FCN出现了,给物体分割提供了一个非常重要的解决思路,其核心就是卷积与反卷积,所以这里就详细解释卷积与反卷积。对于1维的卷积,公式(离散)与计算过程(连续)如下,要记住的是其中一个函数(原函数或者卷积函数)在卷积前要翻转180度图一对于离散卷积,f的大小是n1,g的大小是n2,卷积后的大小是n1+n2-12.图像卷积图二同样地,卷积的时候需要对卷积核进行180的.原创 2020-05-19 14:09:43 · 4744 阅读 · 0 评论 -
一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)
网络上有海量的文本信息,想要处理这些非结构化的数据就需要利用 NLP 技术。本文将介绍 NLP 的基本概念,2大任务,4个典型应用和6个实践步骤。NLP 为什么重要?“语言理解是人工智能领域 皇 冠 上的明珠”比尔·盖茨在人工智能出现之前,机器智能处理结构化的数据(例如 Excel 里的数据)。但是网络中大部分的数据都是非结构化的,例如:文章、图片、音频、视频…一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)在非结构数据中,文本的数量是最多的,他虽然没有图片和视频占原创 2020-05-14 08:37:51 · 3891 阅读 · 1 评论 -
矩阵和向量--形象理解线性代数的本质(三) 矩阵的升维和降维
引子:降维打击科幻小说《三体》里一种很魔幻的攻击方法——降维打击,以其神奇的作用方式和巨大的威力刷新了我们的三观。而在矩阵乘法计算中,这种降维打击时刻存在着。本节讲解一下矩阵乘法中造成的升维和降维。一、矩阵的降维还用游戏的例子,有4个角色,每个人都有不同的能力,将其用矩阵表示出来现在我们要评估他们的两种能力:领兵打仗的能力和协同将领的能力只要将两个矩阵相乘,就能根据 方法 X 对象...原创 2020-04-09 10:14:40 · 2425 阅读 · 0 评论 -
矩阵和向量--线性代数的本质--矩阵、线性变换、矩阵乘法与线性变换复合
线性代数的本质,源视频 https://www.bilibili.com/video/BV1ys411472E目录矩阵和线性变换矩阵乘法与复合变换Unfortunately, no one can be told what the Matrix is. You have to see it for your self.------ Morpheus矩阵是什么?矩阵(Matrix)是一...原创 2020-04-09 10:04:51 · 1556 阅读 · 0 评论 -
向量与矩阵--形象理解线性代数的本质(二) 矩阵乘法的3种理解方式
矩阵的乘法有3种不同的方法去解释它们的意义,而这三种方法都是等效的。分别是: 坐标空间的变换 跃迁运动 方法乘以对象引子:二维平面上有A、B两个点。很明显,对于这两个点,我们可以任意建立坐标系;而不同的坐标系下A、B 具有不同的坐标值。一、坐标空间的变换现在,坐标系1中有C(1,2)、D(3,2)两个点,可以将它们在坐标系中可视化表示出来,就是矩阵A。现在,我们在这个...原创 2020-04-09 09:54:33 · 2339 阅读 · 2 评论 -
OpenCV+TensorFlow 入门人工智能图像处理-opencv中的机器学习
在已经学习了图像的特效,几何变换,图形绘制的基础上。机器学习是什么?机器学习的方式来达成某种功能使用场景: 人脸检测,车辆识别,安防监控深度学习:机器学习 = 训练样本 + 特征 + 分类器深度学习 = 海量的训练样本 + 人工神经网络对于机器学习来说,需要一个明确的特征进行提取。对于深度学习样本需求更多的数量。区分ios和安卓系统?机器学习可以进行特征提取,ios 三个字母,A...原创 2019-03-25 20:26:06 · 101920 阅读 · 0 评论 -
图像处理算法——RGB颜色空间
RGB颜色空间RGB(red,green,blue)颜色空间最常用的用途就是显示器系统,彩色阴极射线管,彩色光栅图形的显示器 都使用R、G、B数值来驱动R、G、B 电子枪发射电子,并分别激发荧光屏上的R、G、B三种颜色的荧光粉发出不同亮度的光线,并通过相加混合产生各种颜色;扫描仪也是通过吸收原稿经反射或透射而发送来 的光线中的R、G、B成分,并用它来表示原稿的颜色。RGB色彩空间称为与设备相关的...原创 2019-03-29 14:18:20 · 122748 阅读 · 0 评论 -
在移动互联网上,图像识别Face++可以做什么?
“在互联网上,没人知道你是一条狗”。这是1993年《纽约客》杂志关于互联网匿名性的经典论述。时光荏苒,二十年后,这已经是一个“看脸”的时代了。那只狗还能否蒙混过关?教会计算机识别喵星人的Google Brain现在还识别不出来汪星人,不过,做图像识别的Face++已经可以明确的告诉机器,你不是一条狗了。Face++是一家专注于图像识别和深度学习的技术公司,成立于 2012 年,当时获得了...原创 2019-04-07 23:30:26 · 100550 阅读 · 0 评论 -
图像处理的滤镜算法
灰度滤镜将颜色的RGB设置为相同的值即可使得图片为灰色,一般处理方法有: 1、取三种颜色的平均值 2、取三种颜色的最大值(最小值) 3、加权平均值:0.3R + 0.59G + 0.11*Bfor(var i = 0; i < data.length; i+=4) { var grey = (data[i] + data[i+1] + data[i+2]) / 3; ...原创 2019-03-29 12:48:02 · 100531 阅读 · 0 评论 -
Tesseract验证码图片预处理--去噪点和干扰线
在获取http://www.mayidaili.com/free 中的IP代理数据时候,发现里面的端口号是图片格式的,一些干扰线是随机生成的,并且端口号颜色单一。利用发现的规律和在NuGet获取的Tesseract,先对图片做了预处理。然后开始对图片识别。 private static Bitmap removeLine(Bitmap img) { ...原创 2019-05-02 18:02:14 · 6907 阅读 · 0 评论 -
计算机视觉与图像处理、模式识别、机器学习学科之间的关系
在我的理解里,要实现计算机视觉必须有图像处理的帮助,而图像处理倚仗与模式识别的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分。纵观一切关系,发现计算机视觉的应用服务于机器学习。各个环节缺一不可,相辅相成。计算机视觉(computer vision):用计算机来模拟人的视觉机理获取和处理信息的能力。就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进...原创 2019-03-25 20:13:03 · 114139 阅读 · 1 评论