随机种子不随机(random_state)

随机种子在机器学习中用于控制数据划分的重复性。当random_state值固定时,训练集和测试集的划分保持一致,便于结果复现。不设置时,划分结果会变化。尽管它是一个超参数,但通常不进行调参,直接设为任意值以确保可重复性。设置随机种子有助于他人复现实验并确保代码的可预测性。
摘要由CSDN通过智能技术生成

 

X_train,X_test,y_train, y_test = train_test_split(X, y, random_state=0)

我们在机器学习中,经常会使用划分训练集和测试集的类train_test_split,而其中有一个参数是random_state,人们给了它一个好听的名字,叫做随机种子。

那么这个随机种子的作用是什么呢,它该如何设置取值呢?

  • 其实随机种子控制每次划分训练集和测试集的模式,其取值不变时划分得到的结果一模一样,其值改变时,划分得到的结果不同。若不设置此参数,则函数会自动选择一种随机模式,得到的结果也就不同。

也就是说:相同的随机种子取值,对应同一种数据集的划分结果。

  • 在需要设置random_state的地方给其赋一个值,当多次运行此段代码能够得到完全一样的结果,别人运行此代码也可以复现你的过程。

也就是说:设置随机种子的值可以是任意的,可以是0或1或2,甚至是9999,只不过对应的代码运行结果不同。有助于我们复现别人的实验结果!

  • 若不设置此参数则会随机选择一个种子,执行结果也会因此而不同了。虽然可以对random_state进行调参,但是调参后在训练集上表现好的模型未必在陌生训练集上表现好,所以一般会随便选取一个random_state的值作为固定值参数。

也就是说:一般情况下,随机种子的值我们可以随便设置,虽然它是一个超参数,但是我们一开始就固定它的值,不再去对他进行调参,对我们的模型的影响是微乎其微的。

 

自信点,大胆尝试任何事情,年轻人就是要犯错,就是要经历失败!

  • 10
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沉淀体育生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值