异常值检测
异常值检测之LOF
判断输入值是否为数值型数据,在输入数据类型相同的情况下判断俩点之间的距离
语法点:
一、isinstance(object, classinfo)
参数
object – 实例对象。
classinfo – 可以是直接或间接类名、基本类型或者由它们组成的元组。
返回值
如果对象的类型与参数二的类型(classinfo)相同则返回 True,否则返回 False
二、range 函数
range函数可创建一个整数列表,一般用在 for 循环中。
语法:
range(start,stop, step)
参数:
start: 计数从 start 开始。默认是从 0 开始。例如range(5)等价于range(0,5);
stop: 计数到 stop 结束,但不包括 stop。例如:range(0,5) 是[0,1,2,3,4]没有5
step:步长,默认为1。例如:range(0,5) 等价于 range(0,5,1)
三、enumerate函数
enumerate函数用于将各种迭代器(如列表、元组或字符串)包装为生成器,生成器每次产生一对输出值,前者表示循环下标,后者表示从迭代器中获取到的下一个序列元素。一般用在 for 循环当中。
需要知道当前元素在列表中的索引,推荐用enumerate代替range,代码便于简洁和易理解。
语法:
enumerate(sequence, [start=0])
参数:
sequence: 一个序列、迭代器或其他支持迭代对象。
start:下标起始位置。
四、zip函数
zip函数可以把两个或两个以上的迭代器封装为生成器,以便稍后求值。
生成器会从每个迭代器中获取下一个值,然后把这些值汇聚成元组。
语法:
zip([iterable, …])
参数:
iterabl:一个或多个迭代器
定义LOF类
一、map() 函数语法:
map(function, iterable, …)
参数
function – 函数
iterable – 一个或多个序列
返回值
Python 2.x 返回列表。
Python 3.x 返回迭代器。
二、join()函数
语法: ‘sep’.join(seq)
参数说明
sep:分隔符。可以为空
seq:要连接的元素序列、字符串、元组、字典
上面的语法即:以sep作为分隔符,将seq所有的元素合并成一个新的字符串
返回值:返回一个以分隔符sep连接各个元素后生成的字符
对样本点每个维度的坐标进行标准正态化
**
计算第k距离
**
k-distance:第k距离
对于点p的第k距离定义如下:
*