HuFeiHu's Blog

知无涯者,虚心若愚,求知若饥,勇者天佑 !

HDFS的运行原理

简介 HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Google File System)Google 文件系统(中文,英文)。 HDFS有很多特点:     ① 保存多个副本,且提...

2016-11-26 21:31:20

阅读数:203

评论数:0

Java快速教程

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!      Java是面向对象语言。这门语言其实相当年轻,于1995年才出现,由Sun公司出品。James Gosling领导了Java的项目小组。该项目的最初只想为家电设...

2016-11-26 21:25:41

阅读数:166

评论数:0

高质量Java开发者博客

名称(站点名或人名) 国家 备注 1 Adam Bien 德国 Java EE相关 2 Antonio Goncalves 法国 Java EE相关(《Java EE 5》和《Java EE 7》的作者) 3 Henrik Warne 瑞典 编程...

2016-11-26 21:24:28

阅读数:151

评论数:0

流形学习

流形学习(manifold learning)的一些综述 流形学习(manifold learning)的一些综述 讨论与进展 issue 26 https://github.com/memect/hao/issues/26 Introduction http://blog.sina.co...

2016-11-26 21:22:27

阅读数:278

评论数:0

模式识别十一--分类回归决策树CART的研究与实现

文章转自:http://www.kancloud.cn/digest/prandmethod/102853 摘 要:本实验的目的是学习和掌握分类回归树算法。CART提供一种通用的树生长框架,它可以实例化为各种各样不同的判定树。CART算法采用一种二分递归分割的技术,将当前的样本集分为两个子样本集...

2016-11-26 19:40:16

阅读数:406

评论数:0

模式识别十--k-均值聚类算法的研究与实现

本实验的目的是学习和掌握k-均值聚类算法。k-均值算法是一种经典的无监督聚类和学习算法,它属于迭代优化算法的范畴。本实验在MATLAB平台上,编程实现了k-均值聚类算法,并使用20组三维数据进行测试,比较分类结果。实验中初始聚类中心由人为设定,以便于实验结果的比较与分析。 一、技术论述 1.无监督...

2016-11-26 19:38:06

阅读数:531

评论数:0

模式识别九--模拟退火算法的设计与实现

本文转自:http://www.kancloud.cn/digest/prandmethod/102851         本节的目的是记录以下学习和掌握模拟退火(Simulated Annealing,简称SA算法)过程。模拟退火算法是一种通用概率算法,用来在一个大的搜寻空间内寻找命题的最...

2016-11-26 19:37:15

阅读数:3704

评论数:0

模式识别八--三层BP神经网络的设计与实现

本文的目的是学习和掌握BP神经网络的原理及其学习算法。在MATLAB平台上编程构造一个3-3-1型的singmoid人工神经网络,并使用随机反向传播算法和成批反向传播算法来训练这个网络,这里设置不同的初始权值,研究算法的学习曲线和训练误差。有了以上的理论基础,最后将构造并训练一个3-3-4型的神经...

2016-11-26 19:35:01

阅读数:1004

评论数:0

模式识别七--非参数估计法之Parzen窗估计和k

文章转自:http://www.kancloud.cn/digest/prandmethod/102849        本实验的目的是学习Parzen窗估计和k最近邻估计方法。在之前的模式识别研究中,我们假设概率密度函数的参数形式已知,即判别函数J(.)的参数是已知的。本节使用非参数化的方...

2016-11-26 19:33:54

阅读数:2167

评论数:1

模式识别六--感知器的实现

文章转自:http://www.kancloud.cn/digest/prandmethod/102848         在之前的模式识别研究中,判别函数J(.)的参数是已知的,即假设概率密度函数的参数形式已知。本节不考虑概率密度函数的确切形式,使用非参数化的方法来求解判别函数。由于线性判...

2016-11-26 19:31:57

阅读数:595

评论数:0

模式识别五--PCA主分量分析与Fisher线性判别

文章转自:http://www.kancloud.cn/digest/prandmethod/102847         本实验的目的是学习和掌握PCA主分量分析方法和Fisher线性判别方法。首先了解PCA主分量分析方法的基本概念,理解利用PCA 分析可以对数据集合在特征空间进行平移和旋...

2016-11-26 19:30:39

阅读数:910

评论数:0

模式识别四--最大似然估计与贝叶斯估计方法

文章转自:http://www.kancloud.cn/digest/prandmethod/102846         之前学习了贝叶斯分类器的构造和使用,其中核心的部分是得到事件的先验概率并计算出后验概率 ,而事实上在实际使用中,很多时候无法得到这些完整的信息,因此我们需要使用另外一个...

2016-11-26 19:29:12

阅读数:2948

评论数:0

模式识别三--MATLAB实现贝叶斯分类器

文章转自:http://www.kancloud.cn/digest/prandmethod/102845 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。也就是说,贝叶斯分类器是最小错误率意...

2016-11-26 19:23:51

阅读数:10329

评论数:0

模式识别二--分类器的性能评价

文章转自:http://www.kancloud.cn/digest/prandmethod/102844 模式识别:分类器的性能评价 最近开始了模式识别的学习,对模式和模式类的概念有一个基本的了解,并使用MATLAB实现一些模式类的生成。而接下来如何对这些模式进行分类成为了学习的第二个重...

2016-11-26 19:21:54

阅读数:522

评论数:0

模式识别一--利用MATLAB生成模式类

最近开始了模式识别的学习,在此之前需要对模式和模式类的概念有一个了解,这里使用MATLAB实现一些模式类的生成。在此之前,引用百科上对于模式识别和模式类的定义,也算加深以下了解: 模式识别(Pattern Recognition):人类在日常生活的每个环节,从事着模式识别的活动。可以说每个有正常...

2016-11-26 19:17:41

阅读数:4323

评论数:0

Ubuntu 软件安装、查找、卸载--apt-get、apt-cache命令安全

# apt-get update :在修改/etc/apt/sources.list或者/etc/apt/preferences之後运行该命令。此外您需要定期运行这一命令以确保您的软件包列表是最新的。 # apt-get install packagename :安装一个新软件包(参见下文的ap...

2016-11-26 19:00:02

阅读数:1239

评论数:0

机器学习资源大全中文版

我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资源整理。awesome-machine-learning 就是 josephmisiti 发起维护的机器学习资源列表,内容包括了机器学习领域的框架、库以及软件(按编程语言排序)。 Awesome 系列虽然挺全,但...

2016-11-26 13:01:24

阅读数:873

评论数:0

机器学习常见算法分类汇总

机器学习常见算法分类汇总 2016-11-08 算法与数学之美 原文出处:IT经理网   机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法很多。很多时候困...

2016-11-26 13:00:22

阅读数:699

评论数:0

Spark计算过程分析

摘要: ### 基本概念----------Spark是一个分布式的内存计算框架,其特点是能处理大规模数据,计算速度快。Spark延续了Hadoop的MapReduce计算模型,相比之下Spark的计算过程保持在内存中,减少了硬盘读写,能够将多个操作进行合并后计算,因此提升了计算速度。同时Spar...

2016-11-26 12:46:41

阅读数:3797

评论数:0

诠释数据降维算法:一文讲尽t-分布邻域嵌入算法(t-SNE)如何有效利用

摘要: t-分布领域嵌入算法(t-SNE, t-distributed Stochastic Neighbor Embedding )是目前一个非常流行的对高维度数据进行降维的算法, 由Laurens van der Maaten和 Geoffrey Hinton于2008年提出。这个算法已经在机...

2016-11-26 12:42:55

阅读数:3036

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭