所以基本上,min_sample_split
是分割所需的最小样本数。例如,如果min_sample_split = 6
并且节点中有4个样本,则不会发生拆分(不管熵是多少)。在
另一方面,min_sample_leaf
基本上是叶节点所需的最小样本数。假设min_sample_leaf = 3
并且一个含有5个样本的节点可以分别分裂成2个和3个大小的叶子节点,那么这个分裂就不会发生,因为最小的叶子大小为3
所以基本上,min_sample_split
是分割所需的最小样本数。例如,如果min_sample_split = 6
并且节点中有4个样本,则不会发生拆分(不管熵是多少)。在
另一方面,min_sample_leaf
基本上是叶节点所需的最小样本数。假设min_sample_leaf = 3
并且一个含有5个样本的节点可以分别分裂成2个和3个大小的叶子节点,那么这个分裂就不会发生,因为最小的叶子大小为3