最近看了看侯景新老师写的《区域经济分析方法》一书,书中对区域分析常用的方法进行了梳理和罗列,虽然从纵向上看不是很深,但基本覆盖了区域分析的方方面面,唯一比较缺憾的是在GIS的空间统计与智能分析方面涉及较少,包括探索性空间数据分析和空间回归等,这些也是区域分析中常用的内容,书中涉及不多。另外就是,成书时间较早,最新的进展方面尚有不足。不过从总体上看,国内涉及到的区域经济分析的书很少很少,这是非常不错的一本。下面是做的一些笔记和摘要:
1区域经济与定量分析
在社会科学研究中,一定要将定性分析与定量分析相结合。定性分析是定量分析的基础,只有在定性分析为定量分析提供了一个可靠的理论和模型框架之后,定量模型才可以进行。
定量分析试图在一定的假设条件下,将研究对象的结构、组成结构的各因子之间的项目关系及外部环境对研究对象的影响以数字或数学公式表现出来,以期对研究对象有一个比较精确的偏于理性的了解。
区域经济作为社会科学中经济学的一个重要分支,具有较强的综合性和应用性。一方面,综合性导致区域分析中需要采用的定量方法多而庞杂,另一方面,应用性导致区域经济学比其他一些应用性较弱的学科更迫切的需要采用定量方法解决一些实际问题。因此定量方法在区域经济学方法论中占有相当重要的地位。
在区域经济的定量分析方法中,地理信息系统是最活跃的一支。
经济计量学、计量地理学和系统科学构成了区域经济定量方法的三个来源。数学基础和计算机基础是区域经济定量分析方法的两个基础。
统计指标和数值按照作用不同进行划分,可以分为总量指标(如GDP)和比例指标。其中,比例指标又称相对数,包括无名数(如人口出生率)和有名数(如人口密度)。比例指标比较适宜进行对比分析(所以通常我们在研究诸如北京就业空间结构等问题时,采用的指标是每个区划的就业密度而不是就业人口总量)
常见的统计量有很多:集中趋势度指标(众数、中位数、分位数、平均数)、离散趋势度指标(极差、平均差、方差和标准差)、相对离散趋势度指标(极差系数、平均差系数、标准差系数)。其中,需要关注的是标准差系数,标准差系数又叫变异系数或离散系数,即标准差与平均值的比值,适合于比较不同组数据的离散趋势,在区域经济研究中应用较多,需要引起注意。
2回归分析在区域经济的应用
研究对象与影响因素之间的关系包括函数关系(确定)和相关关系(不确定)。
所谓回归就是用统计手段找出变量间近似的函数关系的方法。
通常的回归思路是,以一元回归为例,找出研究对象的影响因子(或者对多个因子进行单个分析),画出研究对象和单个因子的散点图,看是线性关系还是别的什么关系(近似于哪种函数曲线),若是明显的线性关系,则进行一元线性回归(若不是可采用别的函数方程回归,若不明显,则多选用几种方式进行回归,因为后面还有回归检验)。如对城市化水平和经济发展水平(人均GDP)进行分析,可以建立人均GDP(x)影响城市化水平(y)的回归方程。线性回归采用的数学方法包括最常用的最小二乘法(LSE)等(注意详细的推导过程)。
检验线性关系是否存在的定量方法就是方程显著性检验。主要由F检验和相关系数检验(R)。
回归分析的重要作用不是寻求函数关系,而是进行预测和控制。在进行预测和控制时,要计算置信区间。
若观察研究对象与影响因子的散点图,更符合其他函数曲线(指数方程、对数方程、幂函数等),可以转换成线性关系进行回归(取对数等)。
对于多元回归的显著性检验,一方面要对回归方程进行检验(F、R),一方面还要对每个回归系数进行检验(t、F),对于不显著的自变量,应予以剔除。
多元回归时,若回归方程总体检验显著性非常高,而各个回归系数检验显著性非常低,则表明各个回归变量之间具有线性相关关系。这时候,就采用逐步回归。
需要注意的是,在多元回归得到的方程中,若某个自变量的系数为负,并不意味着该自变量与因变量负相关,只能反映多个自变量的综合影响结果,所以若要考察某个自变量的相关性,只有对这个自变量和因变量进行相关分析。
3聚类分析在区域经济的应用
对样本的分类是Q聚类,对特征的分类是R分类。实际中Q聚类更普遍一些。常见的聚类分析有层次聚类法、迭代聚类、快速聚类法(K均值)等。
聚类时应进行相似性测度,主要包括距离测度和相关测度。距离测度衡量的是样本之间综合的距离远近程度(即关注总体方面),相关测度是衡量样本之间结构上的相似程度(即关注结构方面)。所以在进行经济总量方面的聚类,应为距离测度,如是产业结构方面的,应为相关测度。距离测度常用的方法有欧式距离等,相关测度常用的方法有相关系数和夹角余弦。
聚类分析的过程是(层次聚类法)先进性相似性测度,得到相似性度量矩阵,然后各类中最相似的两个合成一个新类,求新类与其余各类的相似性,再将最相似的两类合并,这样循环,最后聚成一个大类ÿ