r语言错误记录
第一个问题,重复id识别
面板数据整理好后可以通过面板数据框进行整理,看看是否是平衡数据
这个面板数据就很干净,可以进行运行
这个数据存在不可识别的部分,年份应该是16年,有些样本重复或被重复记录了
a <- table(data1$id)
summary(a)
all(a==16)
which(a!=16)
delect_ids<-which(a!=16)
通过查找和识别出现错误的样本数据进行删除,可以解决部分问题
第二个问题,如何清洗
采取这个方式可以删除混乱数据
第三个问题,处理后依然存在不平衡
抱歉,这个问题我还没有解决,在上述处理后T=16-34,但是重复删除多余id不能解决问题,所以发布出来请高人帮忙,我坚信,遇到错误了,要求助网友、学友、百度和谷歌,不能放弃错误。因为每一次错误都是学习改进的机会,就把cnds微博作为我们的错题本吧。