【源码】datasetSplit:自动数据集拆分函数

在这里插入图片描述

在机器学习或其他项目中,通常的做法是保存一定百分比的数据用于测试,其余(通常较大的数据块)用于训练。此函数可以实现相同的功能。用户可以提供为训练数据保留的百分比。

During machine learning or other projects, it is a usual practice to save some percentage of data for testing and the rest (usually larger chunk) is used for training. This function accomplishes the same. The user has the freedom to provide the percentage to be reserved for training.

Inputs ->

i. the complete dataset (grouped by one type of label only)(IMP: get rid of the col titles’ row)

ii. percentage of the dataset to be dedicate towards ** testing** dataset (usually smaller portion of the whole dataset)

Outputs ->

i. first is the larger chunk of the dataset (training dataset)

ii. smaller chunk of the dataset (testing dataset)

更多精彩文章请关注公众号:在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值