20世纪六十年代,人们开始了对地质灾害易发性评价的研究,九十年代后伴随着计算科学和信息量论以及模糊数学论等众多学科被引入到地质灾害的研究领域,地质灾害易发性评价由最初的定性发展逐步向定量发展转换,即以数据资料为基础和依据,更加客观的反映地质灾害的易发性的真实状况。目前基于GIS的地质灾害易发性评价方法大致可以分为两大类。例如以层次分析法、频率比法、证据权法和逻辑回归为代表的统计方法,另一类是神经网络模型、模糊综合判定法、信息量模型、支持向量机模型为代表的数学模型法。
1统计分析法
层次分析法(AHP):萨蒂在20世纪九十年代提出层次分析理论的“1-9标度法”用来解决多因子决策问题。层次分析法将因子大致分为目标层、准则层和方案层,分析思路是确定研究区域的方案层要素因子,按照各因子相互之间存在的内在关系,建立层次结构模型,通过对比两两因子之间的重要性,建立判断矩阵进行层析分析排序,确定各因子的相互重要性。层次分析法的优势是根据判断矩阵定量计算出各因子的权重,虽然判断是人为的,但矩阵需要通过一致性检验判断权重是否科学,一致性检验通过后,才能真正确定各因子的权重值,大大减小了主观性和错误的可能性,确保了层次分析法在地质灾害易发性评价上的运用是科学的。它的局限性是在构造判断矩阵时,评价指标过多,统计量大,指标间存在很强的相关性导致模型失真,且由于决策者很难掌握标度的标准,这会导致收敛较慢,迭代次数多,从而在计算上花费时间。
频率比法(FR):基于地质灾害分布与诱灾因子之间的关系,通过统计地质灾害与评价因子之间的频率比值来表示地质灾害位置与评价因子的相关程度。FR以1为界限,值越大即评价因子与地质灾害间的相关性越强。频率比法,是一种纯数理统计方法,对于滑坡发育机理缺少深入的研究。
逻辑回归(LR):从统计学的角度来说,各因子都可以作为自变量,灾害的发生与否可以作为应变量。由于是不连续变量,因而不能采用线性回归模型,这种情况下通常采用对数线性模型,而逻辑回归模型就是一种特殊形式的对数线性模型。逻辑回归模型操作方法简单,计算过程不受主观因素的影响,评价结果的物理意义明确,但逻辑回归一般需要基于大量的样本统计规律,需要大量的数据支持。
证据加权法(WEM):1990年加拿大数学地质学家Agterberg在基于贝叶斯理论上提出的,用于统计分析计算地质灾害评价因子的权重值。使用证据加权法有两个前提条件:一、各因子之间要相互独立,二、各评价因子需要长期保持不变的。因此致灾因子不稳定的地区,在进行易发性分区评价时就不能采用证据加权法。因此该方法具有很大的局限性。
2数学模型
信息模型(IM):根据受影响地区已知的滑坡灾害因素,计算提供的信息量,并建立评估和预测模型。信息方法在单元划分数量较多的研究领域更有优势。但是,信息统计只能反映不同影响因素在特定组合下的灾害的易发性,而不能反映各个因素影响程度的差异,可能存在某个评价因子对灾害发育具有抑制作用,与自然规律不符。为解决这一问题,需要对评价因子进行加权,以反映各种因素对滑坡的不同影响,并采用加权信息评价模型,提高评价的准确性。信息量模型经常被使用去检验其他模型的评价结果,且效果较好。理论上信息量模型对易发性评价所涉及的因素的标志状态分类没有任何特殊要求,但研究表明,因子选择的合理性和代表性,要能够反映灾害的活动特征。地质灾害具有一定的随机性,仅对过去的灾害因素进行分析和预测,缺乏对灾害形成机制的分析判断,那么分析的准确性取决于采集的数据量的小,这样使得评价的结果具有一定的局限性。
人工神经网络模型法(ANNM):一种模拟人脑结构和神经网络进行信息处理的数学模型。它是由大量的处理单元联结而成,具有一定的学习能力和适应能力。自该方法提出以来就被广泛用于灾害评价和预测等领域,并产生了令人满意的结果。其中BP神经网络模型应用的最为成熟,最为广泛。BP采用反向学习规则,也称为反向传播神经网络。这是一个根据误差反向传播算法训练的多层前馈网络。BP网络是一种具有强大自适应、自学习和非线性映射能力的监督学习算法。它具有更少的数据、更少的信息、更好的解决不确定性问题的方法,并且不限于非线性模型。典型的BP网络由三层组成:输入层、隐藏层和输出层。输入层是地质灾害评价因子,输出层主要输出地质灾害易发性评价结果,而隐含层主要的作用是用于修正误差。但人工神经网络对输入输出层有严格的要求,而地质灾害易发性评价中的输出层(易发等级)很难与实际数据相互匹配,因此地质灾害易发性评价中应用开发人工神经网络的技术难点在于训练样本的选择。虽然BP神经网络非线性度高、具有较强的泛化能力,但也存在收敛速度慢、迭代步长多、容易出现局部极小值、全局搜索能力差等缺点。
模糊综合评价(FCE):一种基于模糊数学的将定性评价转化为定量评价的综合评价方法。可以基于对确定性或不确定性因素的综合评价,对不明确、复杂、模糊、难以量化的因素进行量化。地质灾害易发性的影响因素十分复杂,不确定因素较多。模糊综合评价可以针对不确定因素建立分析模型,综合考虑多因素、多层次的影响,直观地描述风险因素之间的关系,利用概率推理中的先验概率和后验概率来计算、确定风险对不同地区的灾害进行类比分析,然后结合研究区的实际地质条件进行综合评价,使评价结果更加科学。但是,在应用模糊数学理论时,隶属函数的选择更依赖于专家经验,这使得评价的结果具有一定的主观性,而且由于模型的局限性,划分中的网格通常很大,这使得评价结果不够准确。该方法更适用于单一灾害点的评价,对大尺度、区域的地质灾害的易发性的预测和评价具有很大的局限性。
支持向量机模型(SVM):由Vapnik提出,是一种基于统计原理的分类预测模型。该方法通过引入核函数,将特征空间中线性不可分数据转换为多维空间线性可分数据。核函数是支持向量机模型的核心,核函数的选择直接影响运算结果的准确性和效率。常见的支持向量机模型可分为单型支撑和二型支撑。与其他统计预测模型或学习算法相比,支持向量机模型有两个突出的优点:①易于使用,无需对输入参数进行大的调整; ②结合最优理论、统计学和函数分析,计算效率高,预测能力强,在解决小样本、高纬度和非线性问题方面具有优势,避免了人为因素的干扰。当研究区数据不够丰富时,可利用地形图、遥感影像等易得的数据,加上已知灾害点和隐患点的位置,建立地质灾害预测评价模型,快速完成地质灾害易发性的区域评价。但这种方法需要选择合适的核函数,对数学分析和计算机能力要求较高。在这两种类型中,由于单类支持向量机没有地质灾害样本的约束,在相同的预测精度下可能导致区域地质灾害易发性结果偏高。
3.几种常用评价方法的对比
通过上述统计分析法和数字模型法的分析总结,不同方法的优势和局限性如表1所示。由表1可知,不同方法都具有一定的局限性和适用范围。在研究某一地区地质灾害时,由于影响灾害发育的因素众多,所有对灾害的产生有贡献的因素也很难被全部收集到,因此在研究区资料不够充足时,可用已获得的各种来源的数据结合现有的灾害的详细位置资料等,应用一定的数据挖掘模型来建立适合目标研究区的滑坡评价模型,实现地质灾害评价。本文针对不同形成机理的地质灾害,归纳出基于GIS易发性评价基本思路。首先依据已发生地质灾害的规模、大小、地形特征、坡度、岩石性质、断裂等信息进行统计分析,确定评价因子,并进行相应赋值,然后根据地质易发性评价因子选择合适的一种或几种评价方法及模型,最后划分易发性等级,完成地质灾害易发性评价和预测。
表1 各评价方法对比表
评价方法 | 优势 | 局限性 | 适用范围 |
层次分析法 | 评价因子权重经过一致性检验,主观性较小 | 需要构造判断矩阵,指标多,计算量大 | 研究区资料丰富 |
神经网络模型 | 能够自主的学习适应、非线性映射能力强,能够较好的解决数据小、信息贫、不确定性问题 | 在选择训练样本上具有一定的困难,可能会存在收敛速度慢、迭代步数多、全局搜索能力差等问题 | 影响因子高度非线性,数据量少 |
频率比法 | 评价因子与地质灾害之间的相关性容易判断。 | 纯数理统计,对孕灾机理研究较少 | 环境单一,影响因子种类较少 |
模糊综合判定 | 影响因子容易量化 | 函数选取的主观性强,在区划中网格通常较大,使得评价结果不够精确。 | 适合单体的灾害点评价 |
证据加权法 | 效果直观 | 不能有效避免评价因子之间的相互依赖 | 环境稳定,评价因子长期不变 |
信息量模型 | 单元划分数量较大的研究区中更具有优势 | 只能反映不同影响因子在特定组合下的灾害出现的可能性,不能体现各因子的差异性,且需要较大数据量 | 研究区信息量丰富,孕灾因素相互独立 |
逻辑回归 | 操作方法简单,计算过程不受主观因素的影响 | 需要大量的数据用于统计规律 | 因子确定,干扰少的区域 |
支持向量机模型 | 计算效率高、评价预测能力强,在解决小样本非线性问题方面具有较大的优势。 | 核函数选择困难,且核函数直接影响评价结果的精度 | 研究区资料不够丰富的地区 |