【求助】毕业论文数据异常值处理,恳请前辈们指点迷津!

大家好~我是正在准备毕业论文的经管专业学生,研究方向为数字经济,目前遇到一个棘手的问题,想请教各位大佬!  

我的数据涉及河北省11个地级市(2011-2022年)的数据,这一项指标“信息传输、计算机服务和软件业从业人员”。在数据清洗阶段,发现石家庄市近几年的数值远高于其他地级市。虽然已用IQR法(1.5倍)、箱线图和Z-score(阈值>3)检验,结果均显示为异常值,但反复核对河北统计年鉴后确认数据无误。  
目前的困惑是:  
1. 若数据真实无误,这种情况下是否仍需剔除或调整? 应该用何种方法?
2. 是否存在其他方法(如经济背景分析)能合理解释这种“异常”?  
3. 是否有文献或案例支持类似情况的处理方式?  

作为学术小白,深知自己经验不足,恳请各位前辈、大佬不吝赐教!无论是统计方法、经济视角的建议,还是相关文献推荐,晚辈都感激不尽! 
真心求教,感谢每一位点进来的朋友!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值