matlab 算 cramer s v,基于Cramer’s V指数的遥感影像特征选择方法专利_专利查询 - 天眼查...

1.基于Cramer' S V指数的高分辨遥感影像特征选择方法,其特征在于:包括以下步 骤: 步骤1 :对获取的遥感影像进行预处理以及影像特征提取; 步骤2 :基于Cramer' s V关联指数的连续特征离散化并行处理; 步骤3 :并行处理获取两两特征间的列联表; 步骤4 :基于Cramer' s V关联指数的特征选择; 在步骤1中,遥感影像预处理过程包括以下步骤: 步骤1. 1 :根据获取的遥感影像数据源的影像质量,进行相应的预处理,包括几何与辐 射校正、影像拼接与裁剪、影像复原与去噪或影像增强与融合; 步骤1. 2 :提取影像特征:在eCognition平台下对遥感影像进行多尺度分割,或采用模 式识别或数据挖掘技术对遥感影像进行分割,从分割斑块中提取影像的光谱、形状和纹理 特征,结合地理数据,并对非栅格数据进行栅格化处理后,共同组成一个4隹特征的影像数 据; 步骤1. 3 :根据影像中地物实际的分布和分类类别,利用样区工具选择Λ个训练样本, 确认出样区的类别标示,建立这Μ"样本数据与类别标示的-对应关系,形成维 的样本数组Xm = Xti、ι Γ,作为特征选择的输入数据;其中又卜X2 为i/ 维特征的样本数据,Xi =[~.…·Λ·ΜΓ为X的第2雒特征,上标伪矢量转置,C = Ici I. 为目标属性,ς. € (U,…,#示类别数; 在步骤2中,基于Cramer' s V的连续特征离散化并行处理过程包括以下步骤: 步骤2. 1 :对X的每一维连续型的特征X ,把Xi分成由分割点定义的/?个离散区 间D : (ί/ι % ,方法是在删除 xY中可能的重复值后,按从 小到大顺序排列X,.,.½ ………,则分割点B的可能取值为= ,^、 =Am.以及4 =(5 +½,)/],_/ = 1,~,//卜1,®为Xi中剔除重复值后剩余 的元素数目; 步骤2. 2 :初始化离散化划分!)^ : ,设置一个全局变量GCVD=O,\.的最大分 害怄间数r,并设置初始分割区间数k=l ; 步骤2. 3 :从B中取出一个分割点,加入到划分4中并计算该划分对应的Cramer' s V 离散化值,即CVD值;按以上方法分别将B中的每一个可能的分割点加入到划分4中,以分 别计算出每一种划分对应的CVD值; 计算CVD值时,需要建立特征Xi在每种可能的分割条件下与目标属性你]列联表;所 述列联表的建立方法为:在MPICH2平台下采用并行计算,按如下步骤实现: 步骤2. 3. 1 :获取并行处理系统中处理器的节点数目P、各处理器的处理时间·;Γ/ϋ 和CPU处理速度%.,并对处理器进行编码J^f=1 ; 步骤2. 3. 2 :估计各处理器的处理时间·Iai if=1 :所需处理时间的近似估计方法是保证 各计算节点的负载平衡,即分配给各节点的计算量与计算速度近似一致,也就是g W·:近 P/ Wj 似相等,A = ^ρ™7Γ™:; Ζ+ί=ια.,) 步骤2. 3. 3 :根据节点的负载平衡,按照B中®t可能的分割点进行任务划分,并发送 到各处理节点; 步骤2. 3. 4 :每个节点产生一个大小为Γ、C的数组,并按各自分割点取值情况对\.离 散化,形成各自的列联表; 步骤2. 3. 5 :在各节点利用列联表计算\.在该分割情况下与类别标示你]CVD值,计算 方法为: CTDiC,!)^) = ^χ2αί /{Ν mm[〇/ -1), (r - ϊ)]} 其中,CP2)(f_\ I) Xp)表示在离散化廢件下计算特征χ 与类别标示你]Cramer's V值;Λ表示训练样本总数,遗示类别数,= /2 /lll〇/丨,J2的计算公式为 n c μ.2 J2 1],/7表示特征Xi的实际离散化数目,%为类别标示为〇为数 J=I J=I 目,^表示位于第i个离散化区间«+(^内的样本数目,/¾¾示属于#P况类的个体 数目; 步骤2. 4 :当完成B中全部可能的分割点所对应的CVD值计算后,收集器收集各处理节 点计算的rra(IJ) = CYI乂 )]值,为B中分割点 数目; 步骤2. 5 :扫描CTD(D)值,确定出CVD最大值所对应的划分,记为汐,方法是如果 CVD (汐)>GCVD或者k〈r,则用划分汐替代A并设置GCVD = CVD(in,设置k=k+l,否则选 择/¾ Xi的最佳划分,存储Xi与类别标示你 I GCVD值以备后用,即在最佳分割 目标类别的Cramer 's V的值; 步骤2. 6 :重复步骤2. 1~2. 5,循环对其它的特征X7进行离散化; 步骤2. 7 :完成对全部特征Xi (# = …,f/)的离散化后,存储全部连续数据的CVD最 终离散化结果,以备后续步骤使用; 在步骤3中,两两特征间的列联表的获取方式为:在MPICH2平台下采用分布式并行计 算,按如下步骤实现: 步骤3. 1 :获取并行处理系统中处理器的节点数目产以及各处理器的处理时间 和cpu处理速度%.,并对处理器进行编码{jj It1 ; 步骤3.2:估计各处理器的处理时间f=1 ;处理时间的方法是保证各计算节点 的负载平衡,即分配给各节点的计算量与计算速度近似一致,也就是A 近似相等, Pf Ir, ^mmdl=I - 2 * 步骤3. 3 :根据节点的负载平衡,按照特征维数与样本数目对输入数据进行任务划分, 并发送到各处理节点; 步骤3. 4 :每个节点产生一个大小为rX r的数组,并各自统计交叉分类的频数分布表, 形成各节点的列联表; 步骤3. 5 :收集器累加各处理节点产生的列联表,得出输入数据的全体列联表;对全体 列联表行和列的合计栏进行扫描,如果合计栏中某元素为零,则删除列联表中对应的行或 列; ^ I / 在步骤4中,Cramer,S V关联系数定义为F' = J-:~ y,基于 \| Λ -1).ύ - Cramer' s V指数的特征选择按如下步骤进行: 步骤4. 1 :建立一个空集合S,用于存放从集合X中选择的特征,置(6=0表示集合S中元 素个数为零; 步骤4. 2 :利用存储的GCVD值来评估各特征& U = 与目标属性你]关 联系数,即选出GV⑶值最大所对应的那个特征,记为X7,置S = ,并从集合I中 删除已选特征Xi,置(6= 1 ;目标属性尚各特征Xi (/ = L- % ί/)的最大关联表达为 max i(S,c) = F(XpC),其中_是集合s中的元素个数,「(x c)是 p I xe,? 1 - !… 目标属性(¾特征X ,.的Cramer' s V关联系数值; 步骤4.3 :以并行处理方式获取集合S中的每个特征X7^集合{Z-S}中其它特征 XiG = _/)的列联表,总共产生卜(?,一/)个列联表; 步骤4. 4 :根据所生成的列联表,计算两两特征间的Cramer's V关联系数值,并分别求 出集合S中的每个特征X 与集合{X-S}中特征X y之间的平均Cramer ' s V值,则特征X ,与 特征X7的最小关联表达为111111 ,其中F(XpXi):是特征^与 h J x^-的 Cramer' s V 统计值; 步骤4. 5 :根据Cramer' s V关联指数模型,选择指数模型中最大值所对应的那个特征 χίτ (+是;./),置S = ,XjjJ-;选择Cramer' S V关联指数模型为商值模型或差值模型, 分别表不为max 0(左i?), 0 = U或max爽-A,/?), 0 = τ4 -/LR,其中^为惩罚 参数; 步骤4. 6 :从U-S}的候选集合中删除特征X,,已选特征个数f = f +1 ; 步骤4. 7 :重复以上步骤4. 3~4. 6,使用增量方式顺序从候选特征集中选出指定个数的 特征,或者对全部特征按照重要性从大到小排序。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值