2.1数据集包含100个样本,其中500个正例、500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估计有多少种划分方式。
知识储备:
留出法:直接将数据集D划分为两个互斥的集合,训练集按照一定比例从两个互斥集合中分层抽样,测试集则为分层抽样后的剩余数据集。
解:分别从正例集和反例集中分层抽取500*70%=350个数据构成训练集,正例集和反例集各剩余150个数据构成测试集,故总的抽样方式为个。
2.1数据集包含100个样本,其中500个正例、500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估计有多少种划分方式。
知识储备:
留出法:直接将数据集D划分为两个互斥的集合,训练集按照一定比例从两个互斥集合中分层抽样,测试集则为分层抽样后的剩余数据集。
解:分别从正例集和反例集中分层抽取500*70%=350个数据构成训练集,正例集和反例集各剩余150个数据构成测试集,故总的抽样方式为个。