title: “度量空间集聚的DO指数计算工具”
date: “2024-04-22”
categories: 计量经济
今天推出的是DO指数计算工具。
DO 指数方法由Duranton and Overman(2005)提出,用于对产业空间集聚程度进行度量。
DO 指数的计算分为三步:
(1)计算核密度函数。假定行业
I
I
I中存在
n
n
n 家企业,运用每家企业的经纬度数据,可以计算出
n
(
n
−
1
)
/
2
n( n- 1) /2
n(n−1)/2个两两企业对彼此的空间距离,它与实际交通距离存在一定偏差,但对估计结果影响不大,Duranton and Overman(2005)曾详细阐述了这一问题。计算该行业两两企业彼此距离的核密度函数
K
^
(
d
)
\hat{K}(d)
K^(d)的公式如下:
K
^
(
d
)
=
1
n
(
n
−
1
)
h
∑
i
=
1
n
−
1
∑
j
=
i
+
1
n
f
(
d
−
d
i
,
j
h
)
\hat{K}(d)=\frac{1}{n(n-1)h}\sum_{i=1}^{n-1}\sum_{j=i+1}^{n}f(\frac{d-d_{i,j}}{h})
K^(d)=n(n−1)h1i=1∑n−1j=i+1∑nf(hd−di,j)
其中,
d
d
d 表示两两企业彼此的空间距离,
d
i
,
j
d_{i,j}
di,j表示企业
i
i
i 与企业
j
j
j 之间距离值,
f
f
f为高斯核密度函数,h 表示窗宽。
因为企业规模的大小会明显地影响企业的分布模式特征,所以本文采用企业就业人数作为规模的权重进入核密度函数,加入权重后公式如下:
K ^ E M P ( d ) = 1 h ∑ i = 1 n − 1 ∑ j = i + 1 n ( e i + e j ) ∑ i = 1 n − 1 ∑ j = i + 1 n ( e i + e j ) f ( d − d i , j h ) \hat{K}^{EMP}(d)=\frac{1}{h\sum_{i=1}^{n-1}\sum_{j=i+1}^{n}(e_{i}+e_{j})}\sum_{i=1}^{n-1}\sum_{j=i+1}^{n}(e_{i}+e_{j})f(\frac{d-d_{i,j}}{h}) K^EMP(d)=h∑i=1n−1∑j=i+1n(ei+ej)1i=1∑n−1j=i+1∑n(ei+ej)f(hd−di,j)
其中, e i e_i ei和 e j e_j ej分别表示企业 i i i与企业 j j j的就业人数。Duranton and Overman(2005)最初使用 e i e j e_ie_j eiej项加权,但 Behrens and Bougna(2015)认为这样的设置会增加权重的极端差异,将其改为了 e i + e j e_i+e_j ei+ej项加权,这里采用了该设置方法。
(2)反事实实验。为了识别行业 I I I的空间分布模式,在计算该行业两两企业彼此距离的核密度函数后,再将其与无约束条件下企业随机分布假定的核密度函数进行比较。然而因为自然地理环境以及土地利用政策的局限,很多地区无法建造工业企业,因此,要利用目前约束条件下企业随机分布的核密度函数。本文构建以下反事实.将考察区域所有企业的位置信息表示为总集 S,从中随机地抽取 n n n 家企业位置数据代替行业 I 的企业进行空间分布的模拟 ,运用这 n n n 个模拟的经纬度数据, 由公式(10)计算出一次反事实的核密度函数。本文对每个行业重复反事实实验 1000 次。
(3)构造置信区间。根据固定距离 d d d,本文将获得的行业 I I I的 1000 次反事实的核密度按升序进行排序,并选择 5%与 95%作为置信区间的下限 K ‾ I ( d ) \underline{K}_{I}(d) KI(d)与上限 K ‾ I ( d ) \overline{K}_{I}(d) KI(d),伴随着距离 d d d的增加可得到置信带,该置信带一般被称为局部置信区间。对固定距离 d d d,当$\hat{K} ( d) > > >\overline{K}I(d) 时,该行业可认定为在某个距离点上以 95 时,该行业可认定为在某个距离点上以 95 时,该行业可认定为在某个距离点上以95\varphi\mathrm{\epsilon} 的置信水平呈现集聚状态;而当 的置信水平呈现集聚状态;而当 的置信水平呈现集聚状态;而当\hat{K}(d){<}\underline{K}_{\iota}(d)$时,可认定为在某个距离点上以 95% 的置信水平呈现分散状态;其他情况为行业呈现随机分布特征。用 φ I ( d ) \varphi_I(d) φI(d) 、 θ I ( d ) \theta_I(d) θI(d)分别代表局部集聚指数和分散指数:
工具界面如下:
可以根据需要,自行指定距离范围和迭代次数。
结果会生成一个包含K值和95%以及99%置信区间详细数值的excel结果文件,以及两张ggplot2风格的绘图,如下:
使用起来十分方便,需要的话,可以直接联系微信canglang12002
参考文献:《开发区政策影响中国产业空间集聚吗》孟美侠,曹希广,张学良
**往期推文:
网络SBM模型(NSBM)复现
**
**
空间马尔科夫工具更新**
**
基于参数化的方向性距离函数(DDF)估算污染物影子价格的工具
QLab增加耦合协调度模型**
**
广义SBM模型的matlab代码**
**
QLab1.4正式发布!增加全排列多边形图示指标法**
**
大量数据时的Dagum基尼系数分解工具**
**