人口特征对投资组合多样化的影响

该博客详细探讨了利用R软件对CHFS数据进行的实证分析,通过投资组合多样化指标、描述性统计和回归分析,揭示了金融知识、投资经验等因素对家庭资产选择的影响。研究发现我国家庭投资组合普遍缺乏多样性,着重于股票和风险资产的配置。文章还展示了线性回归和Tobit回归结果,以理解不同变量对投资健康度的贡献。
摘要由CSDN通过智能技术生成

朋友毕业论文中的实证分析
数据:CHFS
工具:R软件

参考论文
金 融 知 识 、 投 资经验 与 家庭 资 产逸择
-----尹 志 超、 宋 全 云 、吴 雨
中国家庭金融投资组合的风险*过于保守还是过于冒进?
-----路晓蒙 李 阳 甘 犁 王 香
区域金融发展会促进家庭理性投资吗?———基于家庭资产组合多样化的视角
------路晓蒙 赵 爽 罗荣华

从论文中获得的主要信息:
1,投资组合多样化如何体现?
2,描述性分析主要需要哪些指标?
3,自变量如何确定?论文中的模型怎么样?

由于是论文的实证分析,不要求作图,所以描述性分析只是得出数据做了个表

A<-read.csv("E:/R语言练习/人口特征对投资组合影响/实证数据.csv",head=T);
#数据简单处理:
A1<-A;  #接下来在A1中进行,不破坏源数据A
A1<-A1[-1,]; #删掉第一行没用的信息
dim(A1);  #查看数据的大小
A1<-A1[,-(24:33)];  #删掉系统给的多余的空值
names(A1)<-c("AA","BB","CC","DD","EE","FF","GG","HH","II",
"JJ","KK","LL","MM","NN","OO","PP","QQ","RR","SS","TT","UU","VV","WW");
#将列名改成上述名字
Q=1;
for(i in 1:ncol(A1)){Q[i]<-class(A1[,i])}
Q;rm(Q);   	#查看每一列的数据类型

在这里插入图片描述

for(i in 1:23){
A1[,i]<-as.numeric(A1[,i])
};   #把所有列改为数值型

Q=1;
for(i in 1:ncol(A1)){Q[i]<-class(A1[,i])}
Q;rm(Q);   	#查看每一列的数据类型

在这里插入图片描述

A1[,14:23][is.na(A1[,14:23])]=0; #将14列及之后的空值全改为0

A1<-na.omit(A1); #去掉空值的记录

A1[,4][A1[,4]==122]=12;	#将受教育年限122 年的都改为12年,估计是输入数据,手抖多按了个2
for(i in 2:13){
V<-order(A1[,i]);
A1<-A1[V,];
A1<-A1[-(1:(0.005*nrow(A1))),];
A1<-A1[-((nrow(A1)-(0.005*nrow(A1))):nrow(A1)),];
}  #去掉前13列中每个数据的前后0.5%
#描述性分析:
A2<-A1  #接下来在A2中分析,不破坏A1
dim(A2);
apply(A2,2,mean);
apply(A2,2,sd);
apply(A2,2,max);
apply(A2,2,min);  #每个字段的描述性统计量

B<-!((A2[,17]==0)&(A2[,18]==0)&(A2[,19]==0)&(A2[,20]==0)
&(A2[,21]==0)&(A2[,22]==0)&(A2[,23]==0))
sum(B);mean(B);sd(B);max(B);min(B) 	 #金融参与率

B<-!(A2[,17]==0)   
sum(B);mean(B);sd(B);max(B);min(B)	#股票持有率
A2<-A1  #在A2中进行
w<-which((A2[,15]==0)&(A2[,16]==0)&(A2[,17]==0)&(A2[,18]==0)&(A2[,19]==0)&(A2[,20]==0)
&(A2[,21]==0)&(A2[,22]==0)&(A2[,23]==0))
A2<-A2[-w,]      #去掉没投资的人,为了计算

B<-apply(A2[,17:23],1,sum)/apply(A2[,15:23],1,sum);
length(B);B[8229:11609]=0;
sum(B);mean(B);sd(B);max(B);min(B)    #   风险资产占比,包括了没有投资的人
#现在A2是A1去掉了没有投资的人的数据
############################################回归分析:
#计算因变量:


A3<-A2 #在A3中进行
for(i in 15:23){
A3[,i]<-A2[,i]/apply(A2[,15:23],1,sum);
}
D=1-(A3[,15]^2+A3[,16]^2+A3[,17]^2+A3[,18]^2+A3[,19]^2+A3[,20]^2+A3[,21]^2+A3[,22]^2+A3[,23]^2)
D;dim(A3)

D 就是因变量 投资组合多样性,越接近1表示越多样,越健康
计算所用的数据是A2的,因为没有投资的人没有投资组合多样性

hist(D);直方图

在这里插入图片描述
可以看到,由于我国金融行业发展还在初期阶段,我国大部分家庭的投资都不健康,不够多样化,指数很低的占比非常高,

##############################################线性回归(总体的所有变量对投资组合影响):
A4<-A2	#用A4数据回归以免破坏A2
D1<-D		#用D1回归以免破坏D
rm(B)
#直接回归:
B11<-lm(D1~A4[,2]+A4[,5]+A4[,3]+I(A4[,3]^2)+A4[,4]+A4[,8]+A4[,7]
+A4[,6]+A4[,12]+A4[,13]
+A4[,9]+A4[,10]+A4[,11]);
summary(B11);
B12<-lm(D1~A4[,2]+A4[,4]+A4[,8]+A4[,7]+A4[,12]+A4[,13]
+A4[,9]+A4[,10]);
summary(B12)

#回归诊断找出异常点
source("D:\\R软件1\\R-4.0.4\\bin\\i386\\回归诊断1.R") #加载回归诊断函数
C<-Reg_Diag(B12);

在这里插入图片描述
在这里插入图片描述

C;	#内容太多不展示了,把其中具有三个及以上异常统计量的记录删掉了
w1<-c(
265,1896,1876,1844,1792,1712,1322,1312,1166,1039,1017,2678,2633,2615,2617,
2585,2517,2508,2504,2439,2449,2389,2372,3892,3772,3763,3764,3740,3744,3726,
3718,3711,3654,3594,3550,3513,3458,3429,3331,3246,3230,3234,3193,3179,3177,
3047,4994,4993,4991,4984,4976,4965,4924,4870,4858,4856,4855,4840,4826,4812,
4785,4775,4777,4770,4765,4755,4749,4708,4696,4692,4656,4651,4641,4631,4604,
4561,4434,4426,4415,4379,4362,4355,4336,4332,4321,4302,4291,4276,4259,4213,
4193,4170,4161,4157,4153,4149,4143,4118,4071,4003,5980,5966,5967,5923,5918,
5881,5882,5877,5878,5873,5863,5842,5847,5793,5766,5756,5666,5658,5648,5645,
5641,5598,5574,5568,5545,5542,5540,5538,5503,5435,5366,5293,5251,5240,5212,
5200,5174,5140,5133,5144,5145,5101,5099,5074,5059,5061,5043,5044,5045,5039,
5040,5023,6930,6931,6932,6912,6785,6736,6728,6721,6714,6710,6703,6700,6692,
6673,6667,6651,6620,6622,6610,6604,6606,6596,6583,6572,6569,6570,6559,6540,
6528,6530,6532,6534,6525,6510,6507,6496,6494,6493,6492,6489,6482,6477,6474,
6467,6464,6459,6452,6395,6369,6355,6347,6344,6239,6243,6236,6235,6192,6180,
6177,6145,6140,6129,6128,6126,6124,6113,6095,6098,6074,6076,6059,6016,6009,
6004,6003,8228,8227,8225,8223,8219,8215,8210,5202,8196,8178,8177,8176,8175,
8172,8166,8165,8164,8162,8161,8157,8156,8155,8154,8153,8152,8151,8150,8149,
8148,8114,8109,8099,8081,8077,8072,8056,8051,8046,8017,7959,7958,7916,7886,
7864,7803,7804,7754,7717,7712,7685,7682,7670,7667,7650,7631,7626,7619,7613,
7611,7607,7592,7568,7542,7540,7529,7521,7520,7518,7507,7501,7488,7473,7471,
7464,7458,7445,7443,7440,7439,7422,7404,7405,7395,7384,7377,7371,7361,7357,
7343,7333,7332,7331,7329,7321,7306,7297,7293,7275,7263,7253,7249,7234,7228,
7212,7210,7209,7208,7207,7191,9186,7185,7184,7183,7066,7061,7057,7051,7042,
7024,7021,7007,7004);

#去除异常点再回归:

A4<-A4[-w1,];
D1<-D1[-w1];
#去除不显著变量前:
B13<-lm(D1~A4[,2]+A4[,5]+A4[,3]+I(A4[,3]^2)+A4[,4]+A4[,8]+A4[,7]
+A4[,6]+A4[,12]+A4[,13]
+A4[,9]+A4[,10]+A4[,11]);
summary(B13);

在这里插入图片描述

#去除不显著变量后:
B14<-lm(D1~A4[,2]+A4[,4]+A4[,8]+A4[,7]+A4[,12]+A4[,13]
+A4[,9]+A4[,10]);
summary(B14)

在这里插入图片描述

################################线性回归(持股票的人的所有变量对投资组合影响)
A5<-A2;  #在A5中进行  不破坏A2
D2<-D;	#不破坏D
w2<-which(A5[,17]==0);  
A5<-A5[-w2,];		#去掉没有股票的人
D2<-D2[-w2];  		#去掉没有股票的人
dim(A5)
B21<-lm(D2~A5[,2]+A5[,5]+A5[,3]+I(A5[,3]^2)+A5[,4]+A5[,8]+A5[,7]
+A5[,6]+A5[,12]+A5[,13]
+A5[,9]+A5[,10]+A5[,11]);
summary(B21);

在这里插入图片描述

#找出异常值再回归
C1<-Reg_Diag(B21);
w3<-c(4,7,13,31,47,111,121,124,155,209,231,267,
287,313,314,416,554,613,646,648,649,657,665,
687,734,737,738,758,761,764);
A5<-A5[-w3,];
D2<-D2[-w3];
B22<-lm(D2~A5[,2]+A5[,5]+A5[,3]+I(A5[,3]^2)+A5[,4]+A5[,8]+A5[,7]
+A5[,6]+A5[,12]+A5[,13]
+A5[,9]+A5[,10]+A5[,11]);
summary(B22);

在这里插入图片描述

#####################################tobit回归(总体的所有变量对投资组合影响)
D3<-D;  #
A6<-A2; #在A6中回归,不破坏A2
library(AER)
#直接回归:
B31<-tobit(D3~A6[,2]+A6[,5]+A6[,3]+I(A6[,3]^2)+A6[,4]+A6[,8]+A6[,7]
+A6[,6]+A6[,12]+A6[,13]
+A6[,9]+A6[,10]+A6[,11])
summary(B31)

在这里插入图片描述

#去除异常值再回归
A6<-A6[-w1,]
D3<-D3[-w1];

B32<-tobit(D3~A6[,2]+A6[,5]+A6[,3]+I(A6[,3]^2)+A6[,4]+A6[,8]+A6[,7]
+A6[,6]+A6[,12]+A6[,13]
+A6[,9]+A6[,10]+A6[,11])
summary(B32)

在这里插入图片描述
结果较好

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值