随机化
随机打乱输入数据集的类、属性和/或元数据。
输入
数据:输入数据集
输出
数据:随机化的数据集
随机化小部件接受一个数据集作为输入,并输出一个相同的数据集,其中类、属性和/或元数据被随机打乱。
1.选择您想要打乱的数据集列组。
2.选择您想要打乱的数据集的比例。
3.生成可复现的结果。
4.如果选中了“自动应用”,则更改会自动提交。否则,您需要在每次更改后按下“应用”。
5.生成报告。
随机化小部件通常放置在文件小部件之后,随机化部件(Randomize widget)允许用户随机打乱数据集的类、属性和/或元数据。其中的选项“Replicable shuffling”指的是确保每次执行随机化操作时,得到的结果都是可复现的。
这意味着,无论何时您运行随机化程序,只要参数设置相同,您都将得到相同的结果。这对于确保实验的可重复性非常重要,特别是在进行统计测试或模型训练时,需要确保每次运行都得到一致的结果。
为了实现可复现的随机化,Orange3可能会使用一种方法来设置随机数的种子。种子是一个初始值,用于生成随机数序列。如果您设置了种子,那么每次生成的随机数序列都将相同,因此打乱的数据集也将是相同的。