大数据
文章平均质量分 54
klcola
此人很懒,但也不是什么都没有写
展开
-
两个 0 1 向量之间的相关性计算
本文主要思想来自https://www.cnblogs.com/dan-baishucaizi/p/10096316.html假设 a\bf aa、b\bf bb 两个 0 1 向量a= (x1,x2,⋯ ,xn),其中xi∈{0,1}b= (y1,y2,⋯ ,yn),其中yi∈{0,1}\begin{aligned}\bf{a} =& \ (x_1, x_2, \cdots, x_n), 其中 x_i \in \lbrace 0, 1 \rbrace \\\bf{原创 2022-01-15 16:45:08 · 1235 阅读 · 0 评论 -
如何创建使用 sbt 管理的 spark 项目?
为了方便大家使用,我在 github 上创建了一个 spark 骨架项目,在 bash 环境中运行git clone https://github.com/klcola/spark-skel.git testskel即可在当前目录下创建名称为 testskel 的项目文件夹。你可以将 testskel 替换成你自己的项目文件夹名。你可以随后用 IDEA 或者其他常用的编程工具打开这个文件夹开始编写程序。也可以直接访问 https://github.com/klcola/spark-skel 查看更详原创 2021-01-16 18:05:33 · 153 阅读 · 0 评论