
【代码相似性】
Pz_mstr
混子程序员
展开
-
语言模型NNLM
参考 之后补感想 https://zhuanlan.zhihu.com/p/43453548原创 2020-02-06 16:01:00 · 236 阅读 · 0 评论 -
R^m空间
前言 最近读论文日常看到RmR^mRm这个域,数学功底不够,补一下 RmR^mRm空间 R1R^1R1中两点x,y之间的距离 d(x,y)=|x-y| R2R^2R2中两点x=(x1,x2x_1,x_2x1,x2),y=(y1,y2y_1,y_2y1,y2)之间的距离 d(x,y)=(x1−y1)2+(x2−y2)2\sqrt{ (x_1-y_1)^2+(x_2-y_2)^2}(x1−y...原创 2020-02-04 23:58:30 · 1502 阅读 · 0 评论 -
词向量
前言 之后补自己的感想 https://www.jianshu.com/p/cea79c81f90a原创 2020-02-03 11:38:10 · 169 阅读 · 0 评论 -
Minihash && LSH
有空补自己的理解和思考 参考文献 https://www.jianshu.com/p/535c537a5766原创 2020-01-26 22:47:00 · 795 阅读 · 0 评论 -
Jaccard index记录
Jaccard index Jaccard index,用于比较有限样本集之间的相似性和差异性。 Jaccard index值越大,样本相似性程度越高。 定义 给定两个集合A,B,Jaccard 系数定义为A与B交集的大小与A与B并集的大小的比值,定义如下 当集合A,B都为空时,J(A,B)定义为1。 与Jaccard 系数相关的指标叫做Jaccard 距离,用于描述集合之间的不相似度。Jacc...原创 2020-01-26 21:18:10 · 1128 阅读 · 0 评论