DataFrame 数据集切分

smallTutou

已于 2022-04-15 15:58:28 修改

阅读量2.8k

点赞数

分类专栏： Python 机器学习文章标签： python

于 2021-11-08 11:19:47 首次发布

本文链接：https://blog.csdn.net/smallTutou/article/details/121204251

版权

Python 同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

机器学习

5 篇文章 0 订阅

订阅专栏

DataFrame 数据集切分

#方式1

  	from sklearn.model_selection import train_test_split 

	 # split train set and test set
    data_train, data_test = train_test_split(data, test_size=0.2, random_state=1234)

    # split validate set and test set
    data_test, data_val = train_test_split(data_test, test_size=0.5, random_state=1234)

#方式2

	n_ratings = data.shape[0]
    test = np.random.choice(n_ratings, size=int(train_test_ratio * n_ratings),
                            replace=False)  
    test_idx = np.zeros(n_ratings, dtype=bool)
    test_idx[test] = True
    tp_test = data[test_idx]
    tp_train = data[~test_idx]

    n_ratings = tp_test.shape[0]
    test_valid = np.random.choice(n_ratings, size=int(test_valid_ratio * n_ratings),
                             replace=False)  ##replace:True表示可以取相同数字，False表示不可以取相同数字
    valid_idx = np.zeros(n_ratings, dtype=bool)
    valid_idx[test_valid] = True
    tp_valid = tp_test[valid_idx]
    tp_train = tp_test[~valid_idx]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

smallTutou

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
DataFrame 数据集切分

DataFrame 数据集切分#方式1from sklearn.model_selection import train_test_split # split train set and test setdata_train, data_test = train_test_split(data, test_size=0.2, random_state=1234)# split validate set and test setdata_test, data_val = train_test_s
复制链接

扫一扫