![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据集
来路与归途
来路慢慢,情不知所起;
归途遥远,眨眼便是过去。
展开
-
数据集划分
留出法:直接将数据集D划分为两个互斥的部分,其中一部分作为训练集S,另一部分用作测试集T。 通常训练集和测试集的比例为70%:30%。同时,训练集测试集的划分有两个注意事项: 1. 尽可能保持数据分布的一致性。避免因数据划分过程引入的额外偏差而对最终结果产生影响。在分类任务中,保留类别比例的采样方法称为“分层采样”(stratified sampling)。 2. 采用若干次随机划分避免单次使用留出法的不稳定性。交叉验证法:先将数据集D划分为k个大小相似的互斥子集,每次采用k...原创 2020-07-04 17:35:22 · 2610 阅读 · 1 评论 -
tensorflow数据清洗
import tensorflow as tfimport numpy as npimport randomimport osimport mathfrom matplotlib import pyplot as pltdef get_files(file_dir): """ 创建数据文件名列表 :param file_dir: :return:...原创 2019-11-02 19:30:21 · 767 阅读 · 0 评论