nothing-xianm-CSDN博客

原创聚类算法K-Means++介绍与实例

K-Means++算法介绍K-Means++主要解决初始化种子点的问题，其选择初始种子的基本思想是：初始聚类中心之间相互距离要在K-Means算法基础上引入了更智能的初始化步骤，该步骤倾向于选择彼此相距较远的中心点，这一改进使得K-means算法收敛到次优解的可能性很小。K-Means++算法表明，更智能的初始化步骤所需计算量是值得的，因为他可以大大减少寻找最优解所需运行算法的次数。K-Means算法实现步骤1.取一个中心点C1，从数据集中随机选择一个中心点。2.取一个新中心点Ci，选择一个概率为

2021-07-16 21:09:37 2483 1

原创零-均值标准化推导过程

正态分布自然界中的很多随机变量都服从或近似服从正态分布，如测量的误差，人群的身高，体重，工厂产品的直径、长度、重量，电源的电压，因此正态分布是实践中应用最广泛的、最重要的分布。标准正态分布若X的密度函数为f(x)=12πe−x22,−∞<x<+∞f\left ( x \right ) = \frac{1}{\sqrt{2\pi }}{e}^{-\frac{x^{2}}{2}} , -\infty <x< +\infty f(x)=2π1e−2x2,−∞

2021-07-11 11:27:28 1469

原创 k-means聚类算法实现

聚类算法简介在未知模式识别问题中，通常需要从一堆没有标签的数据中找到其中的关联性。一是要发现数据之间的相似性，也被称为聚类（Clustering）；二是要统计数据在空间上的分布，也就是密度估计。聚类可谓无监督学习中最重要的一个作用。聚类的定义聚类是将集中具有相似特性的数据分类组织的过程，聚类技术是一种无监督学习。聚类又称为群分析，是研究样本或指标分类问题的一种统计分析方法。聚类与分类的区别是其要划分的类是未知的，常用的聚类分析法中有系统聚类法、有序样本聚类法、动态聚类法、模糊聚类法、图论聚类法和聚类预

2021-07-11 00:06:18 498 2

qq_45402214的博客

原创聚类算法K-Means++介绍与实例

原创零-均值标准化推导过程

原创 k-means聚类算法实现

原创 [pytorch]通过CNN实现手写数字识别（附完整代码）

原创 TF-IDF的应用（一）比较文章相似度（附完整代码）

原创 jieba实现基于tf-idf算法的关键词提取（附完整代码）

原创 python常见异常以及解决方案

转载中文分词算法—— 基于词典的方法

原创 pytorch实现DNN-例子

原创 from…import * 语句与 import 区别

转载什么是最小二乘法

转载 python ——super的用法

转载 PyTorch计算图

原创 Pandas（一）

原创信息熵

转载数据挖掘 - 分类与回归

转载项目进度管理（下）（重要考点）

转载项目进度管理（上）(考试重点)

原创项目范围管理（重点）-真题答案与解析

空空如也

空空如也