1、图像采集,使用摄像头采集图像(RGB彩色)
2、灰度转换,按照转换公式gry=0.34r + 0.33g + 0.33b,因为对于计算机而言,所有颜色都应该是平等的,并不是由人眼视觉产生的rgb差异化灰度(gry=ur+vg + wb)。
3、统计灰度的正态分布,限制灰度的高低5%灰度为感扰灰度,变更为最近高低灰度值。
注:灰度值统计分析可能会给出其他的图像相关特征,比如边缘像素的分布,灰度分布非正态,另,可以对像素点的梯度值进行统计分析,也可以中和其他像素变换的特征进行统计分析。
4、按正态分布中心定位拉伸灰度到全范围(255)。
5、使用视觉细胞对象方法,生成视觉图像。
每像素一个对象,计算像素属性:
原RGB值
像素值(灰度)
像素位置(坐标)
像素周围点的梯度值
像素边缘属性(一个边缘像素取决于其相邻像素的灰度梯度,根据梯度的阈值进行过滤,形成不同于之下的边缘像素属性,对图像进行由粗到细的分隔过程,阈值越小,分隔越细)
像素方向属性(边缘方向,八个方向对应相邻的八个像素)
周围像素指针(访问周围像素对象,8个)
所属块表指针链(属于多个块)
其他像素属性
6、生成像素块链表(按照周围像素的属性)
7、计算基础块表属性
基础快链表属性:
像素块坐标(x,y,wid,hig)
块层属性(基础块=0,包容快向上增大)
包容快链表指针(属于块的指针)
8、过滤块链表(需要具体识别目标的属性)
9、剩余链表组合生成识别目标图像(完成视觉处理过程)
注意:在梯度的边缘过程中可能会出现过度灰度
(边缘不闭合形态,此时需要再次统计计算过度过程的边缘像素
1.不同的边缘像素出现在同一个块中时,可判断为边缘不闭合。
2.按照边缘梯度像素的灰度值判定块边缘的灰度阈值
3.用此灰度阈值计算边缘附近的过度灰度是属于快里还是快外
4.是边缘封闭,形成梯度封闭快)
10、机器学习是将输入点的‘所有属性’根据接收神经元的DNA过滤器生成并存储到这个神经元中,并产生输入点属性值得输出,使初始输入值向下一个神经元点运动,依次产生神经元的DNA过滤属性,最后达到适合的结果。
初始输入(原始属性)--> 神经元的DNA过滤 --> ... ... -->靶向属性(过滤后原始属性含有的靶向属性比率值)
原始输入属性经过一系列神经元的过滤(DNA靶向权重),得到初始值的靶向属性比率,然后根据经验值判断初始输入是否满足靶向值。其中的‘经验值’就是机器学习的结果(数据归纳法结果)。
2018-09-30
对于图像分析,每一个像素都对应一个视觉神经元,每一个视觉神经元都有一个DNA过滤器,根据图像识别特征对像素进行处理,提取像素的全部属性,根据同类汇聚以及联通属性组成图块,每一个图块对应下一组视觉神经元,提取图块属性,进一步汇聚,获取进一步的图块属性,直至完成全图分析,最终得出靶向结果。
关于像素神经元的DNA过滤函数,它是根据目标识别属性(车牌、数值、景物等)的特征进行构造的。其中有一些数据偏好属性。对于通用的图像识别,处理过程和属性表示都需要做通用规划处理,并能根据实际情况做出适当的变化(参考人类的指示处理过程,从基础的本能概念开始衍生出初级知识,再到高级知识,通过当前环境和已有知识综合识别视觉目标)。
知识的表示是通用识别的基本结构,它是识别过程中产生的,也是从其他已有知识交流中获取的。有以下几种属性:
1、从感知中获取的属性,可以从视觉、听觉、触觉等感觉中获取。
2、可以从文本(文章)中提取,对文本的语义上的理解。
3、从现象中获取,对于发生的周围环境变化,获取知识,并给出相应对策。
4、其他方面的输入。
基本的知识,是与生俱来的本能性知识,所有其他衍生知识都是从基本的本能知识发展而来的,而本能知识是与DNA有关的,根据DNA的不同,相同的感知会得出有差异的衍生知识,这就是多样性和多层次性(聪明和愚蠢的分类)。
DNA是一个输入输出变换函数,对于视觉图像,是一个像素块到实物图像转换的函数,从单像素块到合成块,逐渐形成目标物体图像,最后确定输出目标物体的知识表示。这个逐渐合成图块的过程是一个图像处理与已有指示结合的过程,通过这个过程达到认知图像所表达知识,并添加到本系统中(形成自学习)。
本人的感悟,企图用‘对象’的神经元像素类模拟视觉神经的处理过程。
====================================2018-10-10
关于图像处理(2018-10-10)
实现图像颜色的处理
像素的色彩属性,根据RGB三色空间色彩分布理论。
1、计算像素相对于三色轴的夹角cosα,分别标记为Rcosα,Gcosα,Bcosα,并获取RG,GB,BR差值,标记为:RG>0 则1,RG=0则0,RG<0则-1,并分别用两个二进制位表示,01,00,11。此三角平面表示像素颜色的轴属性,其值为一个字节00xxxxxx。
2、计算像素对色平面的夹角cosα,分别标记为RGcosα,GBcosα,BRcosα,并获取RGB,GBR,BRG差值,标记为:RGB>0则1,RGB=0则0,RGB<0则-1,并分别用两个二进制位表示,01,00,11。此三焦平面表示像素颜色的面属性,其值为一个字节00xxxxxx。
3、组合像素颜色的轴属性和面属性,形成像素颜色的RGB属性,其值为一个字(16位二进制值),这个值能够描述像素在颜色空间中的属性。