将数据集切割为训练集和测试集后，保存为文件

最新推荐文章于 2023-03-22 23:44:11 发布

不学习不能活

最新推荐文章于 2023-03-22 23:44:11 发布

阅读量6.6k

点赞数 9

分类专栏：实验文章标签： python

本文链接：https://blog.csdn.net/qq_37195179/article/details/107521960

版权

将数据集切割为训练集和测试集后，保存为文件

需求
代码

需求

现在有一训练集，在机器学习中，需要将其按比例划分为训练集和测试集，我们知道划分后是四个变量，然，如何合并也是个问题。在实验中发现三种方法可以用用，先写出来以供参考。

代码

way1：

from sklearn.model_selection import train_test_split

messages_train, messages_test, y_train, y_test = train_test_split(messages, y, test_size=0.25, random_state=1000) 

mess_train = pd.DataFrame(messages_train, columns=['message'])
label_train = pd.DataFrame(y_train, columns=['label'])
mess_test = pd.DataFrame(messages_test, columns=['message'])
label_test = pd.DataFrame(y_test, columns=['label'])

train_data = '../data/first/split/train_data.csv'
test_data = '../data/first/split/test_data.csv'
pd.concat([label_train,mess_train], axis=1).to_csv(train_data