- 博客(2)
- 收藏
- 关注
原创 数据挖掘:数据处理-缺失值处理
1,什么是缺失值? 缺失值即是存在特征或标签为空的样本,包含空值的数据会使挖掘过程陷入混乱,导致不可靠的输出。2,缺失值的来源 造成数据缺失的原因是多方面的,主要有以下几种可能:(1)有些信息暂时无法获取,致使一部分属性值空缺出来。(2)有些信息因为一些人为因素而丢失了。(3)有些对象的某个或某些属性是不可用的,如一个未婚者的配偶姓名。(4)获取信息的代价太大,从而未获取数据...
2020-04-29 21:07:58 2769
原创 数据挖掘:数据处理-异常值处理
数据挖掘:数据处理-异常值处理1,什么是异常值? 异常值即是样本数据中的离群点,将那些明显与其他样本不同的数据视为异常值。异常值虽然数量较少,但是对于模型(对异常值敏感的模型)的影响很大,所以必须对异常值进行处理。2,异常值的来源 异常值的来源主要分为人为误差和自然误差,具体来说包括以下几类:数据输入错误、测量误差、实验误差、故意异常值、数据处理错误、抽样错误、自然异常值。总而言...
2020-04-22 20:31:42 3193
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人