机器学习实战 基于Scikit-Learn和TensorFlow 之创建测试集 第二章端到端的机器学习项目 之 创建测试集 P53 用标识符来决定数据是否进入测试集 import hashlib # 把任意长度的数据转换为一个长度固定的数据串 def test_set_check(identifier,test_ratio,hash): return hash(np.int64(identifier))