![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习硬核手写
Zjhao666
泰山不择细壤,故能成其大;江河不择细流,故能成其深。
展开
-
手写kmeans
算法:首先确定一个k值,即我们希望将数据集经过聚类得到k个集合。 从数据集中随机选择k个数据点作为质心。 对数据集中每一个点,计算其与每一个质心的距离(如欧式距离),离哪个质心近,就划分到那个质心所属的集合。 把所有数据归好集合后,一共有k个集合。然后重新计算每个集合的质心。 如果新计算出来的质心和原来的质心之间的距离小于某一个设置的阈值(表示重新计算的质心的位置变化不大,趋于稳定,...原创 2019-09-28 15:30:42 · 648 阅读 · 0 评论 -
手写knn
算法:算距离:给定未知对象,计算它与训练集中的每个对象的距离; 找近邻:圈定距离最近的k个训练对象,作为未知对象的近邻; 做分类:在这k个近邻中出线次数最多的类别就是测试对象的预测类别。代码:from scipy.io import arffimport numpy as npimport pandas as pdradius = 4 # search radi...原创 2019-09-28 16:23:06 · 274 阅读 · 0 评论 -
手写逻辑斯蒂回归
from scipy.io import arffimport numpy as npimport pandas as pdradius = 4 # search radiusdef distance(point1, point2): return np.sqrt(np.sum([(point1[i] - point2[i]) ** 2 for i in range(4)...原创 2019-09-28 18:58:16 · 262 阅读 · 3 评论 -
手写softmax回归
from scipy.io import arffimport numpy as npimport pandas as pdradius = 4 # search radiusdef distance(point1, point2): return np.sqrt(np.sum([(point1[i] - point2[i]) ** 2 for i in range(4)...原创 2019-09-28 20:04:48 · 378 阅读 · 0 评论 -
手写bp神经网络
from scipy.io import arffimport numpy as npimport pandas as pdradius = 4 # search radiusdef distance(point1, point2): return np.sqrt(np.sum([(point1[i] - point2[i]) ** 2 for i in range(4)...原创 2019-09-29 10:49:10 · 494 阅读 · 0 评论 -
手写cart
from scipy.io import arffimport numpy as npimport pandas as pdiris = arff.loadarff('../dataset/iris.arff')df = pd.DataFrame(iris[0])df = df.sample(frac=1)length = df.shape[0]classes = list(se...原创 2019-09-29 14:12:17 · 256 阅读 · 0 评论 -
手写朴素贝叶斯
from scipy.io import arffimport numpy as npimport pandas as pdradius = 4 # search radiusdef distance(point1, point2): return np.sqrt(np.sum([(point1[i] - point2[i]) ** 2 for i in range(4)...原创 2019-09-29 15:42:11 · 269 阅读 · 0 评论 -
手写pca
import numpy as np# 10 samples, 15 featuresbatch = 20data = np.random.rand(batch, 15)mean = data.mean(axis=0)data -= meancov = np.cov(data.T)eigen_value, feature_vector = np.linalg.eig(cov)e...原创 2019-09-29 16:29:32 · 283 阅读 · 0 评论 -
K均值聚类算法(Kmeans)讲解及源码实现
K均值聚类算法(Kmeans)讲解及源码实现算法核心K均值聚类的核心目标是将给定的数据集划分成K个簇,并给出每个数据对应的簇中心点。算法的具体步骤描述如下。数据预处理,如归一化、离群点处理等。随机选取K个簇中心,记为\...原创 2019-10-07 10:16:56 · 2233 阅读 · 1 评论