- 博客(39)
- 资源 (1)
- 收藏
- 关注
翻译 胶囊间的动态路由
原文链接:Dynamic Routing Between Capsules摘要 胶囊意为一组神经元,其激活向量反映了某类特定实体(可能是整体也可能是部分)的表征。我们使用激活向量的模长来描述实体存在的概率,用激活向量的方向表征对应实例的参数。某一层级的活跃胶囊通过模型变换做出预测,预测结果会用来给更高层级的胶囊提供实例参数。当多个预测值达成一致时,一个高层级的胶囊就会被激
2017-10-31 16:02:26 1189
原创 图像处理技术上的空间域和空间频率域
二者可以通过傅里叶变换相互转化,因为在频率域就是一些特性比较突出,容易处理。比如在空间图像里不好找出噪声的模式,如果变换到频率域,则比较好找出噪声的模式,并能更容易的处理。具体名词解释如下:空间域 英文: spatial domain。 释义: 又称图像空间(image space)。由图像像元组成的空间。在图像空间中以长度(距离)为自变量直接对像元值进行处理称为空间域处理。频率域
2017-10-28 12:54:38 29469 2
原创 可变形的卷积网络
原文链接:Deformable Convolutional Networks代码链接:https://github.com/msracver/Deformable-ConvNets一、首先看看文章的摘要 由于构造卷积神经网络 (CNN) 所用的模块中几何结构是固定的,其几何变换建模的能力本质上是有限的。在我们的工作中,我们引入了两种新的模块来提高卷积神经网络 (CNN) 对变换...
2017-10-28 00:12:08 31134 1
原创 【01】机器学习浅谈
导读:在本篇文章中,将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。当然,本文也面对一般读者,不会对阅读有相关的前提要求。在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常长的文章呢? 我并不直接回答这个问题前。相反,我想请大家看两张图,下图是图一:图1 机器学习界的执牛耳者与
2017-10-25 17:07:42 814
原创 双线性插值原理与实现
在对图像进行空间变换的过程中,典型的情况是在对图像进行放大处理的时候,图像会出现失真的现象。这是由于在变换之后的图像中,存在着一些变换之前的图像中没有的像素位置。为了说明这个问题,不妨假设有一副大小为64x64的灰度图像A,现在将图像放大到256x256,不妨令其为图像B,如图1所示。显然,根据简单的几何换算关系,可以知道B图像中(x,y)处的像素值应该对应着A图像中的(x/4,y/4)处的象...
2017-10-25 11:02:24 2086 2
原创 如何在README.md文件中添加图片
笔者想通过一款离线的编辑文件编辑好带有图像的说明文档,最后一起上传到gitHub,目前仅仅找到doc,ppt等文件可以编辑图片和文字但是在gitHub上对doc等文件不能支持在线浏览,所以不是很友好。md文件支持在线浏览,但是在离线的情况下又不能添加图片,所以以下介绍一种md文件在GitHub线上编辑添加图片的方法,供以参考。1、在github上的仓库建立一个存放图片的文件夹,文件夹名字随
2017-10-25 10:45:48 23246 9
原创 #extend---append的区别
aa = [11,22,33]bb = [44,55]aa.append(bb)print(aa)cc = [11,22,33]dd = [44,55]cc.extend(dd)print(cc)
2017-10-23 15:36:12 371
原创 #for---else的应用
card_info =[{"name":"laowang","age":18},{"name":"laoli","age":28},{"name":"laozhao","age":38}] #定义一个字典name = input('输入要查询的名字:')for person in card_info: if name==person['name']: print("%s\t%d\t"%(
2017-10-23 15:24:57 396
原创 Python列表的增删改查和元祖
一、定义列表1.names = ['mike','mark','candice','laular'] #定义列表2.num_list = list(range(1,10)) #range生成1-10范围内的数,并强制转化成列表二、增:append()、insert()方法1.append()方法:在末尾添加元素#szz = ['ab','jhj','nhy']#szz.ap...
2017-10-23 13:52:52 978
原创 Matlab点运算之灰度直方图
% 灰度直方图 它描述了一副图像的灰度级统计信息,主要应用于图像分割和图像灰度变换等应用当中% 从数学的角度来看,图像直方图描述的是图像各个灰度级别的统计特性,它是灰度值的函数,统计一副图像中各个灰度级出% 现的次数或者概率。有一种特殊的直方图称为归一化直方图,可以直接反应不同的灰度级出现的比率。% 从图形上来说,灰度直方图是一个二维的图,纵坐标为图像中各个像素点的灰度级别,纵坐
2017-10-22 15:54:19 2019
翻译 边缘文本检测:快速的和健壮的场景文本定位算法的研究
论文原文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7780757该论文的目标任务是什么?做边缘文本检测,快速的和健壮的场景文本定位算法的研究,为文字识别提供定位的算法1. 应用场景是什么?文字识别体系中,不同中场景,不同种文字的快速准确定位。实际的生活应用包括:图像与视频检索、多国语言翻译、自动助理等
2017-10-20 20:34:40 2012
原创 概率性机器学习与人工智能
原文链接:Probabilistic machine learning and artificial intelligence该论文的目标任务是什么?这篇综述提供了对概率框架的描述,并且讨论了在这一领域最为先进的技术,换句话说,是概率编程、贝叶斯优化、数据压缩和自动模式识别。1. 应用场景是什么?机器学习面临的未来的数据和将来的行为引发的结果是不确定的,概率理论提供了一
2017-10-17 19:29:08 1754
原创 读完论文要回答的问题
觉得有用的论文多读几遍理解一下就会好很多。理解过程中,始终记得:**该论文的目标任务是什么?1. 应用场景是什么?2. 现存的问题瓶颈?3. 已有最佳方法从哪些思路去解决的?4. 该论文的解决思路?5. 具体方法?6. 还存在的问题?7. 该论文的解决思路能否用到其他什么任务中?好的解决思路要总结出来!!这是读完一篇论文的收获。
2017-10-17 19:24:08 598
原创 我们理解高级视觉吗?---读后总结
原文链接:Do we understand high-level vision?高级视觉缺乏一个唯一的,一致性的定义。最近几十年的工作大多数都集中在对象的识别问题上,主要是在视觉系统的一个场景当中去识别一个或者一群对象。重要的是在其中忽略了对象的位置、大小、光线以及它周围所呈现的物体。当对象识别作为了高层视觉的操作框架的时候,仅仅通过视觉神经来解决问题显然已经不足以解决问题了。所以作者将在
2017-10-14 20:06:49 3401
原创 如何发表论文
昨天晚上和导师聊了一下,下面的经验主要是她给我分享的,我自己补充了一点点自己的见解。发论文流程:第一大步:掌握行业基础1, 先选中感兴趣的一篇(里面会涉及到行业中的一项研究),彻底理解了;2, 将该论文中的相关概念、技术,都查清楚搞懂;3, 将该论文的Reference中非常相关的论文读几篇,理解了;4, 找到该论文的源代码,在自己机器上搭建实验平台并将源码跑通;
2017-10-10 20:48:15 866
原创 【2.1】顺序表
第二章序言上一章的两节介绍了常用的算法,这些算法用来处理零散的数据。实际上我们有时候处理的数据之间是存在一种或者多种特定的关系时,我们称这些关系为结构。通常数据之间有三种基本的机构。(1)线性结构:数据元素之间为一对一的关系。(2)树形结构:数据元素之间为一对多的关系。(3)网状结构:数据元素之间为多对多的关系。什么是线性表?线性表示最基本、最简单、也是最常用的一种数据结构。它是一个含有n个节点的...
2017-10-10 15:44:40 466
转载 6.5OpenCV漫水填充
一、定义所谓漫水填充,简单来说,就是自动选中了和种子点相连的区域,接着将该区域替换成指定的颜色,这是个非常有用的功能,经常用来标记或者分离图像的一部分进行处理或分析.漫水填充也可以用来从输入图像获取掩码区域,掩码会加速处理过程,或者只处理掩码指定的像素点。以此填充算法为基础,类似photoshop的魔术棒选择工具就很容易实现了。漫水填充(FloodFill)是查找和种子点联通的颜色相同
2017-10-09 08:51:11 422
原创 论文阅读方法
一、先看综述先读综述,可以更好地认识课题,知道已经做出什么,自己要做什么,,还有什么问题没有解决。对于国内文献一般批评的声音很多.但它是你迅速了解你的研究领域的入口,在此之后,你再看外文文献会比一开始直接看外文文献理解的快得多。而国外的综述多为本学科的资深人士撰写,涉及范围广,可以让人事半功倍。二、有针对地选择文献针对你自己的方向,找相近的论文来读,从中理解文章中回答什么问题,通过
2017-10-08 23:37:05 1369
翻译 递归神经网络对中文字符的读写——读后感
论文链接:Drawing and Recognizing Chinese Characters with Recurrent Neural Network一、文章标题从标题我们可以看出本文的研究内容是采用递归神经网络实现的中文字符读写的基本操作,我们可以联想到对中文字符的读取是不是识别,那么写又是什么呢?什么又是递归神经网络?二、看摘要Previous research has
2017-10-08 17:10:07 998
原创 CNN—卷积神经网络
目录1、卷积神经网络 2、基本操作 4、pooling层BP 5、im2col 6、code1、卷积神经网络 卷积神经网络(convolutional neural network)是利用模型特性来处理掉输入的波动而获得不变性特征,由LeCun提出,目前广泛的应用于图像数据。2、基本操作 卷积操作主要是f(x)g(x)在重合区域的积分。一维卷积 如下图...
2017-10-08 16:47:52 821
原创 深度学习框架的评估与比较
人工智能无疑是计算机世界的前沿领域,而深度学习无疑又是人工智能的研究热点,那么现在都有哪些开源的深度学习工具,他们各自的优缺点又是什么呢?最近zer0n和bamos在GitHub上发表了一篇文章,对Caffe、CNTK、TensorFlow、Theano和Torch等深度学习工具从网络、模型能力、接口、部署、性能、架构、生态系统、跨平台等方面做了比较。网络和模型能力Caffe可能是第一个主流的工业...
2017-10-08 12:29:10 766
原创 6.4OpenCV形态学图像处理:开运算、闭运算、形态学梯度、顶帽、黑帽
一、案例分析1、开运算开运算(Opening Operation),其实就是先腐蚀后膨胀的过程。其数学表达式如下:开运算可以用来消除小物体、在纤细点处分离物体、平滑较大物体的边界的同时并不明显改变其面积。//-----------------------------------【头文件包含部分】------------------------------------
2017-10-08 09:11:44 2857
原创 【1.2】算法基本举例(下篇)
1.递归算法定义:是一种直接或者间接调用自身的算法。实质:把求解的问题转换为规模缩小了的同类问题的子问题,然后递归调用函数来表示函数的解,通过多次的递归调用,最终可以求出最小问题的解,再返回上层调用,不断地重复,最终得到解的过程。四个特性:(1)必须有可最终达到的终止条件,否则程序将陷入无穷循环;(2)子问题在规模上比原问题小,或更接近终止条件;(3)子问题可通
2017-10-07 22:00:29 474
原创 【1.1】基本算法举例(上篇)
#include #include /*算法的作用:通过一种数学思想找到问题的解决方案*/ //看商品猜价格void guessPrice(){ int oldPrice,price=0,i=0; printf("请设置商品的价格:"); scanf("%d",&oldPrice); system("cls"); p
2017-10-07 20:45:11 1137
原创 6.5OpenCV双边滤波
基本原理: 双边滤波器是针对高斯平滑的提升版本,高斯平滑根据像素邻域的距离决定权重,生成权重的函数为高斯函数,所以叫高斯平滑或者高斯滤波,效果是使图像模糊,并一定程度上的保存边缘,双边滤波的改进是增加了灰度值的影响,也就是邻域的像素灰度值如果和中心像素的灰度值越接近,那么权值在高斯权值的基础上在加上一个相对较大的权值,相反,如果灰度差很大,将会给已生成的高斯模板对应的位置加上一个小的权值,以
2017-10-07 15:07:42 1486
原创 6.4OpenCV中值滤波
无论是直接获取的灰度图像,还是由彩色图像转换得到的灰度图像,里面都有噪声的存在,噪声对图像质量有很大的影响。进行中值滤波不仅可以去除孤点噪声,而且可以保持图像的边缘特性,不会使图像产生显著的模糊,比较适合于实验中的人脸图像。 中值滤波是一种非线性的信号处理方法,因此中值滤波器也就是一种非线性的滤波器。在一定条件下,其可以克服线性滤波器处理图像细节模糊的问题,而且它对滤除脉冲干扰和图像扫描噪
2017-10-07 13:17:32 951
原创 图像噪声简介
一、什么是图像噪声?噪声在图像上常表现为一引起较强视觉效果的孤立像素点或像素块。一般,噪声信号与要研究的对象不相关,它以无用的信息形式出现,扰乱图像的可观测信息。通俗的说就是噪声让图像不清楚。二、噪声来源—两个方面(1)图像获取过程中两种常用类型的图像传感器CCD和CMOS采集图像过程中,由于受传感器材料属性、工作环境、电子元器件和电路结构等影响,会引入各种噪声,如电阻
2017-10-07 11:44:49 42059 1
原创 图像深度简笔
1.定义:图像深度是指存储每个像素所用的位数,也用于量度图像的色彩分辨率的参数。2.详细介绍:图像深度确定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。它决定了彩色图像中可出现的最多颜色数,或灰度图像中的最大灰度等级。比如一幅单色图像,若每个像素有8位,则最大灰度数目为2的8次方,即256。一幅彩色图像RGB3个分量的像素位数分别为4,4,2,则最大颜色数目为2的4+
2017-10-07 10:12:10 744
原创 2.3OpenCV程序计时
#include #include using namespace std;using namespace cv;void main(){ int s = 0; double time0 = static_cast(getTickCount());//取得开始时间 for (size_t i = 0; i < 100000; i++) { s += i; } time0
2017-10-06 20:50:03 385
原创 2.2OpenCV格式化输出矩阵
#include #include using namespace std;using namespace cv;int main(){ Mat M(2,2,CV_8UC3,Scalar(0,0,255));//两行两列 cout << "M= "<< " " << M << endl << endl; cout << "****************************
2017-10-06 20:46:00 580
原创 2.1OpenCV改变图像颜色
#include #include using namespace std;using namespace cv;void main(){ Mat img = imread("D:\\opencv\\pic\\girl3.jpg", 1); Mat dsn; cvtColor(img, dsn, COLOR_RGB2Lab);//改变图片的颜色 imshow("soource"
2017-10-06 19:42:58 3936
原创 1.6OpenCV读取摄像头并做边缘检测
#include "opencv2/opencv.hpp"using namespace cv;void main(){ //从摄像头读入视频 VideoCapture capture(0); Mat edges; //循环显示每一帧 while (1) { Mat frame; capture >> frame; cvtColor(frame, edges, CO
2017-10-06 19:35:56 861
原创 1.5OpenCV读取摄像头
#includeusing namespace cv;void main(){ //从摄像头读入视频 VideoCapture capture(0); //循环显示每一帧 while (1) { Mat frame; capture >> frame; imshow("读取摄像头视频",frame); waitKey(30);//延时30毫秒符合真实的实际动作
2017-10-06 19:31:45 384
原创 1.4OpenCV边缘检测
#include "cv.h"#include#include "highgui.h"#include "iostream"using namespace std;//载入一副图像并进行平滑处理void image_handel(IplImage *image){ //create two window to show some images of inputing or outp
2017-10-06 19:22:54 488
原创 1.3OpenCV播放视频
#include "highgui.h"int main(int argvc, char **argv){ cvNamedWindow("example1", CV_WINDOW_AUTOSIZE);//创建一个窗口 CvCapture *capture = cvCreateFileCapture("D:\\opencv\\video\\cplus.wmv");//通过参数设置确定要读取的
2017-10-06 19:11:57 426
原创 1.2OpenCV图像腐蚀
#include// highgui头文件#includeusing namespace cv;int main(){ Mat srcImg = imread("D:\\opencv\\pic\\mogu1.jpg"); imshow("图像腐蚀前",srcImg); //开始腐蚀 Mat element = getStructuringElement(MORPH_ELLIPSE,
2017-10-06 19:06:02 503
原创 1.1OpenCV读取图像
#include using namespace cv;int main() { Mat img = cv::imread("D:\\opencv\\pic\\index.jpg");//读取图片,这里需要写出对应的文件目录 imshow("test", img);//显示读取的图片 waitKey();//等待按键 return 0;}运行结果:
2017-10-06 18:59:49 500
翻译 无监督学习面临的众多挑战
首先看什么是学习(learning)?一个成语就可概括:举一反三。此处以高考为例,高考的题目在上考场前我们未必做过,但在高中三年我们做过很多很多题目,懂解题方法,因此考场上面对陌生问题也可以算出答案。机器学习的思路也类似:我们能不能利用一些训练数据(已经做过的题),使机器能够利用它们(解题方法)分析未知数据(高考的题目)?最简单也最普遍的一类机器学习算法就是分类(classification)。
2017-10-06 18:15:35 2353
软件过程与管理总结整理精华版
2018-06-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人