数据处理有用代码：

最新推荐文章于 2024-03-05 07:41:14 发布

阿猫的自拍

最新推荐文章于 2024-03-05 07:41:14 发布

阅读量155

点赞数

本文链接：https://blog.csdn.net/weixin_37721058/article/details/89086023

版权

本文介绍了在Python中如何处理机器学习数据。包括如何使用相同的随机种子同步打乱样本数据和标签列表，查找列表中特定元素的所有位置，以及按比例减少数据集。还展示了使用matplotlib绘制不同数据规模对SVM模型准确性的影响。

摘要由CSDN通过智能技术生成

通常做机器学习问题时，需要准备训练数据，通常会把样本数据和标签存放于2个list中，比如train_x = [x1,x2,…,xN][x1,x2,…,xN]，train_y = [y1,y2,…,yN][y1,y2,…,yN]. 有时候是需要将数据shuffle后再做处理的（比如，批量梯度下降算法，需要数据是打乱的）。这时就需要以相同的顺序打乱两个list，那么在python中如何实现呢？可以通过设置相同的随机种子，再shuffle的方式来实现。代码如下：

import random

randnum = random.randint(0,100)
random.seed(randnum)
random.shuffle(train_x)
random.seed(randnum)
random.shuffle(train_y)

查找列表中某元素全部坐标：
Num_locastion = [i for i,x in enumerate(Y) if x == num]

通过映射有比例的减少数据集：
def Test(num):
sample = np.random.choice(range(70000),int(70000*num),replace=False)
for z in range(len(sample)):
X_data.append(X[sample[z]])
Y_data.append(Y[sample[z]])
X_train, X_test, y_train, y_test = train_test_split(X_data, Y_data, test_size=0.30)
score1,score2 = SVC_Kernel(X_train, X_test, y_

最低0.47元/天解锁文章

阿猫的自拍

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据处理有用代码：

通常做机器学习问题时，需要准备训练数据，通常会把样本数据和标签存放于2个list中，比如train_x = [x1,x2,…,xN][x1,x2,…,xN]，train_y = [y1,y2,…,yN][y1,y2,…,yN]. 有时候是需要将数据shuffle后再做处理的（比如，批量梯度下降算法，需要数据是打乱的）。这时就需要以相同的顺序打乱两个list，那么在python中如何实现呢？可以通过...
复制链接

扫一扫