处理数据时,很多时都需要把数据分组。本笔记是我个人以list为例子进行数据分组时的思路和Python代码。假设我已知需要把数据分为多少组,每一组的数据量是平均分配的。然而在现实情况中,数据是存在不被完全平均分到各个组当中,因此会把多余的都放到最后一个组。(结果与使用KFold的效果是相似的)
假设:
- 已知需要把数据分为多少组
- 多余的都放到最后一个组
--
以下是对于本笔记思路的图示说明。
--
以下代码将逐步说明从建立数据到如何分组。由于这次是以分享思路为主,而非分享优秀代码,因此代码会较长且未被优化。
1. 导入需要用到的工具
import math
import random
2. 取得数据 (本例子是以已预定的list作为数据)
test_list = ['a', 'b', 'c', &#