什么可能导致异常值:根据具体事件选择忽略还是重视(欺诈侦测)
传感器故障、(忽略)
数据输入错误、(忽略)
外部数据×
反常事件(通常需要重视)
选择异常值
异常值检测-删除算法
训练
异常值检测——找出训练集中访问最多的点,去除这些点(一般约10%的异常数据)
再训练
(可能需要重复2、3步骤多次)
删除前:
删除后
异常值删除策略小结:这里要注意有的地方是要保留异常值,去除正常的数据的(异常检测、欺诈检测)。
1训练
什么可能导致异常值:根据具体事件选择忽略还是重视(欺诈侦测)
传感器故障、(忽略)
数据输入错误、(忽略)
外部数据×
反常事件(通常需要重视)
选择异常值
训练
异常值检测——找出训练集中访问最多的点,去除这些点(一般约10%的异常数据)
再训练
(可能需要重复2、3步骤多次)
删除前:
删除后
异常值删除策略小结:这里要注意有的地方是要保留异常值,去除正常的数据的(异常检测、欺诈检测)。
1训练