算法
文章平均质量分 77
siss0siss
人生苦短,当学python。
展开
-
python机器学习——数据的分类(knn,决策树,贝叶斯)代码笔记
import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputer#导入数据预处理模块处理原始数据from sklearn.model_selection import train_test_split#导入自动生成训练集和测试集的模块from sklearn.metrics import clas原创 2017-06-16 22:15:35 · 1625 阅读 · 0 评论 -
DBSCAN聚类算法
一、算法原理根据密度进行聚类。三类数据点:核心点,边界点,噪音点。核心点:在半径Eps内含有超过Minpts个数的点。边界点:在半径Eps内含有小于Minpts个数的点,但落在核心点的领域。噪音点:不是以上两种点的点。每个点都要判断一遍,标记为核心点,边界点和噪音点,噪音点要删除。二、算法参数eps:半径min_sample:簇的样本数metric:原创 2017-05-31 20:50:35 · 1667 阅读 · 0 评论 -
KMeans聚类算法
KMeans方法的核心。原创 2017-05-31 14:48:59 · 15329 阅读 · 5 评论 -
降维之PCA主成分分析算法
一、算法原理算法流程:input:样本集:低维空间维数dprocess:1.对所有样本进行中心化2.计算样本的协方差矩阵3.对协方差矩阵做特征值分解4.取最大的d个特征值所对应的特征向量output:投影矩阵:注:以上算法流程改编自周志华《机器学习》算法补充:1.协方差矩阵公式:据查原创 2017-06-02 12:53:36 · 904 阅读 · 0 评论