![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
youlin121
这个作者很懒,什么都没留下…
展开
-
数据挖掘(二)模型评估与选择
2.1经验误差与过拟合 分类错误的样本数占样本总数的比例称为“错误率”(e rate),即如果在m个样本中有a个样本分类错误,则错误率E=a/m; 1-a/m称为“精度”( accuracy),即“精度=1-错误率” 更一般地,我们把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”(eror这里所说的“误差”均学习器在训练集上的误差称为“训练误差”( training error)...原创 2019-11-15 20:38:32 · 584 阅读 · 0 评论 -
数据挖掘(一)简介
概念 1.数据: 数据(英语:data),是指未经过处理的原始记录。 2.大数据: 大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。 (也就是利用常用软件工具获取,管理和处理数据所消耗的时间超过可容忍的时间的数据集) 5个特征: Volume:数据量大,包括采集、存储和计算的量都非常大。 Variety:种类和来源多样化。 Value:数据价值密度...原创 2019-10-25 20:49:39 · 553 阅读 · 0 评论