算法
data_rec
这个作者很懒,什么都没留下…
展开
-
通过矩阵求两个向量集中元素两两之间的欧氏距离(python实现)
在很多算法中都会涉及到求向量欧式距离,例如机器学习中的KNN算法,就需要对由训练集A和测试集B中的向量组成的所有有序对(Ai,Bi),求出Ai和Bi的欧式距离。这样的话就会带来一个二重的嵌套循环,在向量集很大时效率不高。 这里介绍如何将这一过程用矩阵运算实现。 假设有两个三维向量集,用矩阵表示: A=[a11a12a21a22a31a32] B=⎡⎣⎢⎢⎢b11b12b13b转载 2016-12-06 09:49:21 · 2081 阅读 · 0 评论 -
蓄水池抽样
问题:在时间复杂度为O(n)下对大批量甚至未知大小的数据(N)等概率随机抽取k个数。 抽样过程:顺序遍历数据N,遍历的前k个数据抽取出放入容量为k的“蓄水池”(称之为K),从第k+i(i>0)数据开始,以k/(k+i)的概率选择该数据并等概率随机替换K中元素。直到遍历结束。 先不多说,撸一串代码(从0到999这一千个整数随机抽取10个): def sampling(k=10, N=np.原创 2016-11-18 14:49:54 · 350 阅读 · 0 评论