数学建模应用——数据处理分析(以小农户土地流转内卷化现象为例)

基于灰色关联模型的小农户土地流转“内卷化”分析

样本数据来源于4个县的50个村庄,随机从4个县选取50个村庄,对村庄土地进行聚类分析,分析土地数据情况。从农用地流转的现状来看,农用地流转仍然有比较大的地域限制,通常只在同一经济组织内流转,交易的范围比较狭小,同时缺乏交易的透明度,对50个村庄的情分析,4个县的土地流转情况分析,得到下面的结果。

 农地相对位置坐标

x

y

5.688237

2.399162

4.693906

1.233189

0.119021

1.839708

3.371226

2.399525

1.621823

4.172671

7.942845

0.496544

 

                                                        50个农地坐标时序图

利用K-means聚类分析将农地相对坐标进行聚类分析,分类划分区域,便于进一步分析调查研究,分析结果如下:

                                                4次迭代后的K-means聚类结果

通过查找并分析得到调研的4个县的土地基本情况如下表所示:

 调研地土地基本情况

地区

承包土地面积(hm*2

种植农作物面积(hm*2

种植果树面积(hm*2

满意度

滑县

17.58298

11.00632

2.663121

0.730798

杞县

41.54143

13.43007

3.974751

0.779167

沈丘

29.2632

9.086403

2.53098

0.934011

唐河

27.48618

9.044749

3.377651

0.829906

利用灰色关联分析分析4个县土地基本情况的灰色关联度及灰色关联度的相关性,结果如图:

 

                                                        灰色关联相关性分析结果

通过因子分析法分析研究,从小农户土地流转“内卷化”的影响因素群中提取共性因子(这里的共性因子指的是不同影响因素之间内在的隐藏因子),把影响因素之间的错综复杂的关系简化归结成少数综合因子,得到各个影响因素之间的关系机制。

                                                                   正态分布图

选取随机样本从n个市按照每个市的村庄数量按比例分成抽样确定每个市的调研村数量,按照大中小村庄分配每个市需要调研的大中小村庄的数量,从每个市的大中小村庄中分别随机抽样选取出调研村。

aij表示第i个调研市的第j个调研村的a指标设在ij这个调研村中的变量为:

                                                             调查变量设置

 

 

                                                 2009-2015农地流转的发展变化趋势

通过逻辑回归预测、误差精度分析,证明二元逻辑回归预测的精确及样本选取的合理性,如图:

 

                                                   逻辑回归误差精度下降趋势

  • 模型假定

理论分析表明,小农户的农机服务采用,农地的地质情况影响着土地流转决策。

而且,小农户流转后的土地经营规模和土地的地质情况也是小农户是否采用农机服务的重要因素。所以农机服务的采用和土地流转决策,土地的地质情况之间可能存在相互影响。

可假设设如下的方程:

 

控制变量:土地租金,土地流转经历,农机服务采用经历,家庭教育,老年成员,村干部,户主年龄,户主性别,户主教育,户主社保,村道路,村土地使用权。

作用机制分析:农机服务和地质情况通过带动农业技术应用,影响农业劳动力投入和家庭农业资金禀赋的机制间接作用于小农户的土地流转决策。运用逐步回归法分别检验上述的作用机制,设定如下检验模型,利用神经网络训练检验得到如下分析结果,训练效果较好,证明假设的有效性和和合理性。

实际分析各个因子和土地流转内卷化之间影响机制时,可采用灰色关联分析法分析各个指标的关联度大小,对各项指标进行评价,分析建议;采用因子分析法分析各个指标因子与土地流转之间的机制关系进行一定的定量分析。

                                     对数据进行bp神经网络处理后的关联性

                                                        测试预测值和期望值的误差对比 

                                                           最佳训练预测次数

  • 农户经营耕地规模与土地流转率的灰色关联模型
  1. 作用

对于两个系统之间的因素,其随时间或不同对象而变化的关联性大小的量度,称为关联度。在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度。

考虑到土地流转率受多个因素共同影响,单一的线性变化规律不足以体现土地流转率的受制因素,因此引入灰色关联模型对土地流转率的关联因素进行多因素分析。此外,灰色关联模型对样本量的多少与样本有无规律明显要求较低,符合本次调研样本特点,故引入灰色关联模型来进行定量分析。

输入输出描述

输入:特征序列为至少两项或以上的定量变量,母序列(关联对象)为1项定量变量。

建模步骤

确定特征数列和母数列比较序列为

 母序列(即评价标准)为:

 

对指标数据进行量纲统一化

为了真实地反映农户经营耕地规模与土地流转率之间的关联度及其实际情况,排除由于各个指标单位的不同及其数值数量级间的悬殊差别带来的影响,避免不合理现象的发生,需要对指标进行量纲统一化处理。先求出每个指标列的均值,再用该指标列的每一个元素都除以该指标列的均值。

计算关联系数

由下式分别计算每个比较序列与参考序列对应元素的关联系数:

 

为分辨系数,在(0,1)内取值,分辨系数越小,关联系数间差异越大,区分能力越强,通常取0.5

计算关联序度

分别计算其各个指标与参考序列对应元素的关联系数的加权平均值,以反映各操纵装置对象与参考序列间的关联关系,并称其为关联度,记为

 

  1. 分析计算结果

根据灰色加权关联度的大小,建立各评价对象的关联序。关联度越大,表明评价对象对评价标准的重要程度越大。

                                                农户经营耕地规模的分布情况(%)

年份

10亩以下

10-30亩

30-50亩

50-100亩

100-200亩

200亩以上

农地流转率

2009

84.02

12.2

2.57

0.84

0.27

0.11

12.00

2010

85.79

10.83

2.33

0.77

0.19

0.09

14.65

2011

85.94

10.69

2.32

0.75

0.2

0.10

17.84

2012

86.11

10.48

2.31

0.78

0.22

0.10

21.24

2013

85.96

10.28

2.55

0.86

0.24

0.11

25.70

2014

85.93

10.18

2.60

0.89

0.28

0.12

30.36

2015

85.74

10.32

2.60

0.91

0.30

0.13

33.3

如用灰色关联分析预测农户的土地流转率与亩数之间的关系

通过灰色预测模型得到如下结果:

Y =72.0200    0.2000    9.4300   11.1600   11.7300   11.8900

71.1400    3.8200   12.3200   13.8800   14.4600   14.5600

68.1000    7.1500   15.5200   17.0900   17.6400   17.7400

64.8700   10.7600   18.9300   20.4600   21.0200   21.1400

60.2600   15.4200   23.1500   24.8400   25.4600   25.5900

55.5700   20.1800   27.7600   29.4700   30.0800   30.2400

52.4400   22.9800   30.7000   32.3900   33.0000   33.1700

a = 0.2000

b =72.0200

gamma =0.3352    1.0000    0.7969    0.7676    0.7585    0.7559

0.3379    0.9091    0.7492    0.7258    0.7175    0.7160

0.3478    0.8390    0.7027    0.6819    0.6749    0.6737

0.3589    0.7742    0.6591    0.6412    0.6349    0.6336

0.3761    0.7041    0.6121    0.5951    0.5891    0.5878

0.3954    0.6444    0.5678    0.5530    0.5479    0.5466

0.4094    0.6138    0.5428    0.5294    0.5247    0.5234

子序列中各个指标的灰色关联度分别为:

0.3658    0.7835    0.6615    0.6420    0.6354    0.6339

                                            土地规模与土地流转率的关联度

亩数

10亩以下

10-30亩

10-30亩

50-100亩

100-200亩

200亩以上

关联度

0.3658

0.7835

0.6615

0.6420

0.6354

0.6339

 

正向化后的矩阵为:

12.0000    0.0264    0.0000    0.0338    0.8400    0.2700    0.1100

14.6500    0.0040    1.3700    0.0026    0.7700    0.1900    0.0900

17.8400    0.0021    1.5100    0.0013    0.7500    0.2000    0.1000

21.2400    0.0000    1.7200    0.0000    0.7800    0.2200    0.1000

25.7000    0.0019    1.9200    0.0312    0.8600    0.2400    0.1100

30.3600    0.0023    2.0200    0.0377    0.8900    0.2800    0.1200

33.3000    0.0047    1.8800    0.0377    0.9100    0.3000    0.1300

各个指标对于母序列的灰色关联度为:

gamma =[0.8077    0.7534    0.8373    0.7909    0.7976    0.7893    0.7951]

各个指标的权重为:

weight =[0.1450    0.1352    0.1503    0.1420    0.1432    0.1417    0.1427]

标准化后的矩阵为:

Z = 0.1942    0.9649    0.0000    0.4796    0.3822    0.4149    0.3804

0.2371    0.1477    0.3192    0.0369    0.3504    0.2920    0.3113

0.2887    0.0785    0.3519    0.0184    0.3413    0.3074    0.3459

0.3437    0.0000    0.4008    0.0000    0.3549    0.3381    0.3459

0.4159    0.0693    0.4474    0.4427    0.3913    0.3688    0.3804

0.4913    0.0831    0.4707    0.5349    0.4050    0.4303    0.4150

       0.5388    0.1708    0.4381    0.5349    0.4141    0.4610    0.4496

通过分析,以土地规模与土地流转率为例,得到如下结论:

10到30亩规模的土地流转率与土地规模的关联度最大;10亩以下的关联度最小;大于10亩的关联度基本大于0.6,可信较高,可以从关联度方面考虑从土地规模方面提高土地流转率。

   四县土地流转“内卷化”的影响因素调研结果

灰色关联分析:

通过灰色关联分析得到各个影响因素的灰色关联度,其中土地流入率的关联度最大,为0.956416;土地流出率的关联度最低,但总体所有关联度都较高,高于0.7,可以考虑根据各个因素的灰色关联度对因子分析法得到的变量因素机制进行修正和改进,各影响因素最终关联度如下表:

                                                       最终关联度表

 

因子分析法分析小农户土地流转“内卷化”的影响机制

因子分析的基本步骤如下

1.对数据进行标准化处理

2.估计因子载荷矩阵

3.因子旋转,建立因子分析数学模型的目的不仅要找出公共因子并对变量进行分组,更重要的是要知道每个公共因子的意义,以便对实际问题做出科学分析。当因子载荷矩阵A的结构不便对主因子进行解释时,可用一个正交阵右乘A(即对A实施一个正交变换)。由线性代数知识,对A施行一个正交变换,对应坐标系就有一次旋转,便于对因子的意义进行解释。

4.估计因子得分以公共因子表示原因变量的线性组合,而得到因子得分函数。我们可以通过因子得分函数计算观测记录在各个公共因子上的得分,从而解决公共因子不可观测的问题。

从小农户土地流转“内卷化”的影响因素群中提取共性因子(土地流入率、土地流出率、农业劳动力、农业机械化比例、粮食产量、粮食收入、农机服务比例和农业生产效率),对各因子进行分析,结果统计如图:

  因子的描述统计

因子

平均值

标准偏差

分析个案数

土地流入率

25.8250

1.75000

4

土地流出率

25.4500

1.72143

4

农业劳动力

65.547550

5.9005525

4

农业机械化比例

95.8750

2.78014

4

粮食产量

116.508900

40.1291171

4

粮食收入

104.778750

25.7848587

4

农机服务比例

92.2750

3.10524

4

农业生产效率

92.8750

0.86168

4

通过分析,得到各个因子的相关性矩阵,如图:

  各个因子的相关性矩阵表

相关性

a

b

c

d

e

f

g

h

a

1.000

-0.684

0.791

-0.167

-0.989

-0.301

0.918

0.138

b

-0.684

1.000

-0.169

-0.252

0.683

-0.396

-0.340

0.158

c

0.791

-0.169

1.000

-0.101

-0.828

-0.497

0.913

0.600

d

-0.167

-0.252

-0.101

1.000

0.036

0.871

-0.387

0.590

e

-0.989

0.683

-0.828

0.036

1.000

0.220

-0.898

-0.270

f

-0.301

-0.396

-0.497

0.871

0.220

1.000

-0.622

0.116

g

0.918

-0.340

0.913

-0.387

-0.898

-0.622

1.000

0.225

h

0.138

0.158

0.600

0.590

-0.270

0.116

0.225

1.000

从相关性可以看出各个因子之间的相关性,比如土地流入率和农业劳动力的相关性为0.791,相关性较好;土地流入率和农机服务比例的相关性为0.918,相关性较好;农业劳动率和农机服务的相关性为0.913,相关性较好;土地流入率和农业生产效率的关联性为0.138,关联性较差;土地流出率和农业生产效率的关联度为0.158,关联性较差;粮食收入和粮食产量的相关性为0.220,相关性较差等等。

分析得到公因子方差表,初始和提取都为1,证明了因子提取的充分性。

 公因子方差表

因子

初始

提取

土地流入率

1.000

1.000

土地流出率

1.000

1.000

农业劳动力

1.000

1.000

农业机械化比例

1.000

1.000

粮食产量

1.000

1.000

粮食收入

1.000

1.000

农机服务比例

1.000

1.000

农业生产效率

1.000

1.000

  成分矩阵表

因子

成分

0

1

2

3

土地流入率

0.962

0.136

-0.235

土地流出率

-0.464

-0.558

0.688

农业劳动力

0.914

0.039

0.403

农业机械化比例

-0.251

0.941

0.227

粮食产量

-0.957

-0.252

0.143

粮食收入

-0.485

0.848

-0.215

农机服务比例

0.986

-0.158

0.043

农业生产效率

0.273

0.502

0.821

  成分转换矩阵表

成分

1

2

3

1

0.920

-0.311

0.238

2

0.240

0.928

0.286

3

-0.310

-0.206

0.928

 旋转后的成分矩阵表

因子

成分

0

1

2

3

土地流入率

0.991

-0.125

0.050

土地流出率

-0.774

-0.515

0.368

农业劳动力

0.726

-0.331

0.603

农业机械化比例

-0.076

0.904

0.420

粮食产量

-0.985

0.035

-0.167

粮食收入

-0.177

0.982

-0.073

农机服务比例

0.856

-0.462

0.229

农业生产效率

0.117

0.211

0.970

                                                   旋转后的空间中的组件图

                                                                                碎石图

通过碎石图可以得到特征值中前3个变量为主成分分析的因子,了解小农户土地流转“内卷化”影响因素特征值的趋向。

 成分得分系数矩阵表

因子

成分

0

1

2

3

土地流入率

0.272

0.017

-0.076

土地流出率

-0.303

-0.289

0.334

农业劳动力

0.119

-0.107

0.308

农业机械化比例

-0.003

0.371

0.246

粮食产量

-0.264

-0.052

0.004

粮食收入

0.029

0.411

-0.055

农机服务比例

0.188

-0.143

0.062

农业生产效率

-0.059

0.070

0.592

  成分得分协方差矩阵表

成分

1

2

3

1

1.000

0.000

0.000

2

0.000

1.000

0.000

3

0.000

0.000

1.000

分析得到各个因子之间的关系,即农业内卷化的影响机制关系:

 因子分析是主成分分析的扩展和推广,通过对小农户土地流转内卷化影响因素变量的相关系数矩阵内部结构的研究,导出能控制所有影响因素变量的少数几个不可观测的综合变量A,B,C,通过这少数几个综合变量去描述的多个农户土地流转内卷化影响因素变量之间的相关关系。通过因子分析法估计各个小农户土地流转内卷化影响因素(因子)得分表示原因变量的线性组合,进而得到因子得分函数。我们可以通过各个影响因子得分函数计算观测记录在各个公共因子上的得分,从而解决公共因子不可观测的问题,进一步对各个影响指标因素评价分析,比如土地流入率为25.8250,可以得到土地流入率的得分函数:

 

进一步代入公共因子A,B,C得到土地流入率的得分情况,其他的影响因子得分函数类似,分析同上;在知道各个影响因素指标时,可以通过综合得分函数求出小农户土地流转内卷化综合因子A,B,C,代入数据验证分析,得到影响因子的综合矩阵,分析影响因子指标关系,对影响因子进行综合评价分析。

通过调研滑县、杞县、沈丘县和唐河县四县的土地流转情况,用神经网络和灰色关联度,逻辑回归建立模型分析土地流转内卷化的影响因素及关联性。最终总结出四县土地流转量的相关情况,通过时序性分析和相关性分析对比四县的土地流转情况,得到如下的统计分析,2012年到2015年间杞县土地流转量平稳发展,2021年四县的土地流转交易量相差最小,土地流转交易量起伏变化。

                          2010-2021滑县、杞县、沈丘、唐河的土地流转交易量

时间/年

滑县

杞县

沈丘

唐河

2010.00

81.47

57.85

95.72

85.66

2011.00

90.58

54.69

48.54

68.58

2012.00

72.70

95.75

80.03

80.35

2013.00

91.34

96.49

64.19

74.90

2014.00

63.24

95.76

72.18

87.22

2015.00

69.75

97.06

91.57

59.88

2016.00

79.22

67.87

70.60

74.68

2017.00

95.95

75.77

83.18

76.76

2018.00

65.57

74.31

67.69

72.49

2019.00

83.57

59.22

64.62

69.72

2020.00

84.91

65.55

59.71

67.40

2021.00

93.40

87.12

82.35

91.50

 

                      滑县、杞县、沈丘、唐河近12年土地流转交易量统计图

                                                                     时序性分析表

VAR00002

VAR00003

VAR00004

VAR00005

系列或序列长度

12

12

12

12

图中的缺失值数目

用户缺失值

0

0

0

0

系统缺失值

0

0

0

0

 

                                                          土地流转交易量时序图

    滑县、杞县、沈丘、唐河2010-2021土地流转交易量的相关性

VAR00002

VAR00003

VAR00004

VAR00005

VAR00002

皮尔逊相关性

1

-.329

-.172

.070

显著性 (双尾)

.296

.593

.828

个案数

12

12

12

12

VAR00003

皮尔逊相关性

-.329

1

.341

.190

显著性 (双尾)

.296

.278

.553

个案数

12

12

12

12

VAR00004

皮尔逊相关性

-.172

.341

1

.345

显著性 (双尾)

.593

.278

.272

个案数

12

12

12

12

VAR00005

皮尔逊相关性

.070

.190

.345

1

显著性 (双尾)

.828

.553

.272

个案数

12

12

12

12

                                滑县、杞县、沈丘、唐河土地流转的自相关性分析

序列:   VAR00001  

延迟

自相关性

标准误差

博克斯-杨统计自由度

显著性

1

.616

.309

3.989

1

.046

2

.171

.282

4.357

2

.113

3

-.185

.252

4.896

3

.180

4

-.398

.218

8.218

4

.084

5

-.435

.178

14.177

5

.015

a. 假定的基本过程为独立性(白噪声)。

b. 基于渐近卡方近似值。

                                                                  相关性滞后编号 

    滑县、杞县、沈丘、唐河土地流转的偏自相关性分析

序列:   VAR00001  

延迟

偏自相关性

标准误差

1

.616

.378

2

-.337

.378

3

-.215

.378

4

-.189

.378

5

-.116

.378

                                                              偏相关性滞后编号

  • 9
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值