评分卡模型开发-数据集准备

最新推荐文章于 2023-08-31 14:28:35 发布

VIP文章小力丸

最新推荐文章于 2023-08-31 14:28:35 发布

阅读量8.5k

点赞数 3

分类专栏：信用风险评级模型的开发文章标签： R语言评分卡模型开发数据抽样 strata cluster

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lll1528238733/article/details/76599861

版权

在缺失值和处理完成后，我们就得到了可用作信用风险评级模型开发的样本总体。通常为了验证评级模型的区分能力和预测准确性，我们需要将样本总体分为样本集和测试集，这种分类方法被称为样本抽样。常用的样本抽样方法包括简单随机抽样、分层抽样和整群抽样三种。
简单随机抽样：

smp1<-sample(nrow(GermanCredit),10,replace=F)

样本集可表示为：

train_data=GermanCredit[-smp1,]
test_data=GermanCredit[smp1,]

分层抽样：在R中，使用strata()函数来实现上述的分成抽样方法：

strata(data,stratanames=NULL,size,method=

最低0.47元/天解锁文章

关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
评分卡模型开发-数据集准备

在缺失值和处理完成后，我们就得到了可用作信用风险评级模型开发的样本总体。通常为了验证评级模型的区分能力和预测准确性，我们需要将样本总体分为样本集和测试集，这种分类方法被称为样本抽样。常用的样本抽样方法包括简单随机抽样、分层抽样和整群抽样三种。简单随机抽样：smp1<-sample(nrow(GermanCredit),10,replace=F)样本集可表示为：train_data=GermanC
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。