2013年06月_chaoping315

09月 06月 01月

转载聚类——层次聚类 Hierarchical Clustering

不管是GMM，还是k-means，都面临一个问题，就是k的个数如何选取？比如在bag-of-words模型中，用k-means训练码书，那么应该选取多少个码字呢？为了不在这个参数的选取上花费太多时间，可以考虑层次聚类。假设有N个待聚类的样本，对于层次聚类来说，基本步骤就是： 1、（初始化）把每个样本归为一类，计算每两个类之间的距离，也就是样本与样本之间的相似

2013-06-27 14:29:45 1346

转载聚类——监督学习与无监督学习

机器学习的常用方法，主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习，就是人们常说的分类，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就

2013-06-27 14:28:39 23016

转载聚类——混合高斯模型 Gaussian Mixture Model

聚类的方法有很多种，k-means要数最简单的一种聚类方法了，其大致思想就是把数据分为多个堆，每个堆就是一类。每个堆都有一个聚类中心（学习的结果就是获得这k个聚类中心），这个中心就是这个类中所有数据的均值，而这个堆中所有的点到该类的聚类中心都小于到其他类的聚类中心（分类的过程就是将未知数据对这k个聚类中心进行比较的过程，离谁近就是谁）。其实k-means算的上最直观、最方便理解的一种聚类方式了，原

2013-06-27 14:19:30 3169

转载聚类——监督学习与无监督学习

机器学习的常用方法，主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习，就是人们常说的分类，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就

2013-06-27 14:12:57 1134

转载 Hadoop MapReduce中如何处理跨行Block和UnputSplit

Hadoop的初学者经常会疑惑这样两个问题：1.Hadoop的一个Block默认是64M，那么对于一个记录行形式的文本，会不会造成一行记录被分到两个Block当中？2.在把文件从Block中读取出来进行切分时，会不会造成一行记录被分成两个InputSplit，如果被分成两个InputSplit，这样一个InputSplit里面就有一行不完整的数据，那么处理这个InputSplit的Mapper会不

2013-06-26 10:44:22 1272

逻辑回归学数据-个人收入水平调查分析

用于博客中数据样例，博客中程序所使用数据，方便感兴趣同学下载学习，验证。

2018-08-14

使用栈对迷宫求解（c语言版）

用栈对来实现密宫的求解，其中包含了在指定的位置输出指定的字符的操作。

2009-10-31

windows网络与通信程序设计

内容为由王艳平张越编写的《windows网络与通信程序设计》中的反有源代码

2009-10-29

数字图像处理（对灰度图像的各种处理）

对灰度图像的各种处理，包括几何度换正交变换图像增强等

2009-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 聚类——层次聚类 Hierarchical Clustering

转载 聚类——监督学习与无监督学习

转载 聚类——混合高斯模型 Gaussian Mixture Model

转载 聚类——监督学习与无监督学习

转载 Hadoop MapReduce中如何处理跨行Block和UnputSplit

逻辑回归学数据-个人收入水平调查分析

使用栈对迷宫求解（c语言版）

windows网络与通信程序设计

数字图像处理（对灰度图像的各种处理）

空空如也

转载聚类——层次聚类 Hierarchical Clustering

转载聚类——监督学习与无监督学习

转载聚类——混合高斯模型 Gaussian Mixture Model

转载聚类——监督学习与无监督学习