- 博客(3)
- 收藏
- 关注
原创 mllib——实例2:KMeans(含源码分析)
算法:1. 选择k个簇中心,作为聚类中心 。2. 计算每个样本点到聚类中心的距离,将每个样品点分配到最近的聚类中心,形成k个簇。3. 计算每个簇的平均值,并将这个平均值作为新的聚类中心。4. 反复执行2、3步骤,直到旧质心和新质心的差异小于阈值或迭代次数达到要求为止。实例:在IDEA运行,如果是spark-shell命令行窗口,可使用:paste进入粘贴模式,注意...
2019-03-27 11:19:47 1922
原创 FCM-python
总代码:# -*- coding:utf-8 -*-from pylab import *from numpy import*import pandas as pdimport numpy as npimport operatorimport mathimport matplotlib.pyplot as pltimport randomimport copyimport...
2019-03-27 11:05:01 2991 1
原创 RDMA分布式存储系统
文献:基于RDMA的分布式存储系统研究综述作者:陈游旻RDMA是远程直接内存访问,是为了解决网络传输中服务器端数据处理的延迟而产生的。在对方主机cpu不参与的情况下远程读写异地内存,无内核干预和内存拷贝发生。起初,只应用在高性能计算领域,最近,由于在大规模分布式系统和数据中心中网络瓶颈越来越突出,逐渐走进越来越多人的视野。硬件要求:1. cpu和网卡都需要有独立的缓存系统2. ...
2019-03-13 15:18:30 3360
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人