1 定义
1 .1插值分析
在实际工作中,由于成本的限制、测量工作实施困难大等因素,我们不能对研究区域的每一位置都进行测量(如高程、降雨、化学物质浓度和噪声等级)。这时,我们可以考虑合理选取采样点,然后通过采样点的测量值,使用适当的数学模型,对区域所有位置进行预测,形成测量值表面。插值之所以可称为一种可行的方案,是因为我们假设,空间分布对象都是空间相关的,也就是说,彼此接近的对象往往具有相似的特征。
——————————————————————————————
1.2 密度分析
密度分析是通过离散点数据或者线数据进行内插的过程,根据插值原理不同,主要是分为核密度分析和普通的点\线密度分析。核密度分心中,落入搜索区的点具有不同的权重,靠近搜索中心的点或线会被赋予较大的权重,反之,权重较小,它的计算结果分布较平滑。在普通的点\线密度分析中,落在搜索区域内的点或线有相同的权重,先对其求和,再除以搜索区域的大小,从而得到每个点的密度值。
2 差异
插值分析与密度分析的本质就是完全不一样的。 首先,插值分析的目的是对未知区域的数据进行估算,而密度分析仅表现现有数据的聚集情况。
其次,插值分析并不关注空间尺度的问题,而密度分析对空间尺度关注点特别高。
最后,就是插值分析对用于插值的属性是必须要有的,而密度分析最低仅需要有点的位置即可。
————虾神
2.1 举例
为了更好的理解,举一个(可能并不恰当的)例子:
以人口数据为例,有50个点,每个点代表1万人。点的和是50万人。
如果进行插值分析,是已知点求未知点的过程。那么结果栅格,每个格子表示人口数,栅格所有值的和会大于50万。
如果进行密度分析,是将这50万人分摊到某一区域上,结果栅格值的和是等于50万的。
假如我们有一个三个点数据,分别是中国、韩国和日本的人口。点的位置分别在北京、首尔和东京,数值分别为13亿、2亿、1亿。
如果我们进行核密度估算,那么得到的就是人口热力图。整个东亚三国所有的栅格值加起来=13+2+1=16亿。
而如果我们错误地进行了插值分析,那么结果就可怕了:可能北京中心点(假设为天安门)的人口为13亿,而北京大学的人口也有10亿左右!
2.2 从矢量数据的代表性上理解
所以我们可以看到,区分核密度分析、点密度分析的一个关键在于:**点数据(或线数据)的数值是代表整体的还是代表局部的。**又或者说,点数据是否代表一定的面积?还是点,仅仅是那个位置处一个没有面积的点。
人口点数据,很显然是一个代表整体的,数值表示的是这个行政区划内的总体人口,而不是这个点位置处的人口。这样的点数据,其实是与面积的含义在内:中国的人口点数据,数值13亿,潜在的意思为960万平方公里内的人口为13亿。而不是这个点坐标下就有13亿人。
而野外的采样点数据,很显然是代表局部的。因为我们野外实验时就是在某个很小的样方内采样。比如:植被覆盖度。我们在采集植被覆盖度时,总不能所有地方的植被全都测一遍,那样恐怕会累死,碰到个悬崖峭壁的还有生命危险。因此我们只选取具有代表性的样方得到这些位置的植被覆盖度,然后在空间相关性的前提下,估算出全部研究区域的植被覆盖度。
2.3 从二者的名称上理解
其实二者的区别也完全可以从名称上面来理解:
”密度“分析,是内插。既然是密度,那么一定不是一个绝对值,而是物质内部的属性。所以就是我们用点数据的数值”向内部分配“。而所谓的内部,就是指这个点数据所隐含代表的实际的地理单元(一个国家、一个村庄、一个建筑等等)。
”插值“分析,是外插。那么就是对未知的区域进行估算,一定是”向外部插值“。所谓的外部,一定是这个点数据所不能包含的区域。比如,从A、B村庄的数据估算C村庄的数据。
顺便放一个”内插“和”外插“的定义,也可以有助于理解密度分析和插值分析的区别:
用回归方程预测范围以外的数值称为外插法,而内插法是对数据范围内的点进行预测。