suejl-CSDN博客

转载主流nosql数据库对比

转自:http://asyty.iteye.com/blog/1202106主流nosql数据库对比博客分类： NOSQLnosql数据库对比目前开源的NOSQL数据库有，Redis，Tokyo Cabinet，Cassandra，Voldemort，MongoDB，Dynomite，HBase，CouchDB，Hypertable， Riak，Tin， Fl

2016-02-23 10:52:18 1589

什么是概率图，顾名思义，肯定是和概率有关的，它存在的基础是是如何快速利用计算机从看似错综复杂的事物中找出我们想要的答案，而且得保证答案是正确的，那么怎么做呢。如何让一个问题、一堆杂乱的数，以可视化的、有序的方式表示呢？而且还得保证计算机能读懂，能对其进行操作、挖掘内容。这大概就是发掘它的初衷吧。详述起来它可以分为三种表示形式，一种叫贝叶斯网络，一种叫马尔科夫网络，还有就是他俩的混合形式。整体都是由

2015-12-24 14:01:37 1395

转载 HBase 超详细介绍

转自：作者：奥特man，发布于2012-12-14，来源：CSDN1-HBase的安装HBase是什么？HBase是Apache Hadoop中的一个子项目，Hbase依托于Hadoop的HDFS作为最基本存储基础单元，通过使用hadoop的DFS工具就可以看到这些这些数据存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作，如右侧的图所

2015-12-24 11:21:11 1148

原创查找过的LaTex命令记录

1. LaTex 对于正文可以分栏，设置两栏间距的命令为： \setlength{\columnsep}{宽度}设置两栏间分隔线的宽度的命令为： \setlength{\columnseprule}{宽度}两栏间分割线宽度的默认值是0，表示不显示分割线。表示栏宽的参数：\columnwidth其值不能自行设定，

2015-02-24 01:44:48 1135

原创 Markov chain马氏链名词理解

irreducible:是指链从状态空间里一个位置经过有限步转到任何一个位置的概率大于0，即说的是马氏链里任何两个状态都是互通的（communicate）！（区别去规则链:这里ij，不同ij取值经过的使它们互通的步骤可能是不同的。而规则链意思就是肯定存在一个统一的步数，此时所有状态完全互通）%reducible:即可约的意思就是至少存在一个 i到j是不通的！（注意有可能j到i是通的）%

2014-11-19 01:00:08 8979

转载最易懂的先验概率、后验概率与似然估计解释

比较有意思的文章http://hi.baidu.com/hi9394/blog/item/7e5132638102aa760c33faf2.html先验概率、后验概率与似然估计本文假设大家都知道什么叫条件概率了（P(A|B)表示在B事件发生的情况下，A事件发生的概率）。先验概率和后验概率教科书上的解释总是太绕了。其实举个例子大家就明白这两个东

2014-06-11 04:16:27 853

原创 Collections.unmodifiableMap()的简单解释

使用例子 protected Map parseArgs(String[] args) { if (args == null || args.length % 2 != 0) { throw new IllegalStateException("Cannot convert args!"); } Map parsedArgs = new HashMap(

2014-06-02 18:22:18 10227

原创 hadoop jar singlnode下运行的命令行输出

[hadoop@aaa ~]$ hadoop jar /opt/workspace/PGMdriver.jar GibbsSamplingDriver /output14/05/22 20:39:13 INFO client.RMProxy: Connecting to ResourceManager at /0.0.0.0:803214/05/22 20:39:13 WARN mapredu

2014-05-23 03:02:54 1149

原创 jar file 在eclipse运行成功换命令行运行却出错

程序在eclipse运行正确，但是恶心破

2014-05-23 02:41:52 873

转载 [Hadoop源码详解]之一MapReduce篇之InputForma

原创作品，允许转载，转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。http://shitouer.cn/2013/02/hadoop-source-code-analyse-mapreduce-inputformat/1. 概述我们在设置MapReduce输入格式的时候，会调用这样一条语句：?1jo

2014-05-16 05:07:36 706

原创 hadoop 程序遇到的问题

java.lang.Exception: java.lang.RuntimeException: java.lang.NoSuchMethodException: Hadoop_FPTree$MRMapper.init>() at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:403)

2014-05-16 04:18:38 6384 1

转载 hadoop各种输入方法(InputFormat)汇总

mapreduce中,一个job的map个数,每个map处理的数据量是如何决定的呢?另外每个map又是如何读取输入文件的内容呢?用户是否可以自己决定输入方式,决定map个数呢?这篇文章将详细讲述hadoop中各种InputFormat的功能和如何编写自定义的InputFormat. 简介: mapreduce作业会根据输入目录产生多个map任务,通过多个map任

2014-05-16 00:32:02 1096

原创 centos网络显示已连接但无法打开网页

系统centos6.4，桌面系统，使用Networkmanager配置网络已显示连接，但就是ping不通，

2014-05-12 07:52:52 7217

转载 Hadoop技术原理总结

转自1、Hadoop运行原理 Hadoop是一个开源的可运行于大规模集群上的分布式并行编程框架，其最核心的设计包括：MapReduce和HDFS。基于 Hadoop,你可以轻松地编写可处理海量数据的分布式并行程序，并将其运行于由成百上千个结点组成的大规模计算机集群上。基于MapReduce计算模型编写分布式并行程序相对简单，程序员的主要工作就是设计

2014-05-11 19:01:05 849

转载剖析MapReduce作业运行机制

转自http://my.oschina.net/u/1169079/blog/201738

2014-05-11 18:43:02 955

转载 Log4j笔记第一章简单用上Log4j

Log4j笔记第一章简单用上Log4j博客分类：Log4jlog4jXMLApacheEclipse编程第一节概述Log4j诞生，为减轻对成千上万的Java代码 System.out.println(); System.err.println(); e.printStackTrace(); (e为Throwable

2014-05-07 01:31:24 639

转载 Hadoop 2.x的DistributedCache无法工作的问题

现象：和这个帖子描述的一样，简单说来就是，在Hadoop 2.x上，用新的DistributedCache的API，在mapper中会获取不到这个cache文件。下面就详细地描述一下新旧API的用法区别以及解决办法。『1』旧API将HDFS文件添加到distributed cache中：12Configuration conf = j

2014-05-03 05:43:57 962

原创 hadoop distributed cache

distributed cache使用的流程总结如下：1.在HDFS上准备好要共享的数据(text、archive、jar)2.在distributed cache中添加文件3.在mapper或者reducer类中获取数据4.在map或者reduce函数中使用数据

2014-05-03 03:39:07 754

原创我用过的hadoop命令(持续更新）

接上篇转载，此处记录我用过的哈达哦哦怕

2014-05-02 06:03:18 659

转载 hadoop常用命令

分类：原文地址：hadoop常用命令作者：gray1982启动Hadoop进入HADOOP_HOME目录。执行sh bin/start-all.sh关闭Hadoop进入HADOOP_HOME目录。执行sh bin/stop-all.sh 1、查看指定目录下内容hadoop dfs –ls [文件目录]e

2014-05-02 05:53:55 624

原创 hadoop 未启动datanode

分别运行 start-dfs.sh, start-yarn.shjps后只有

2014-05-02 04:09:15 973

原创 Gibbs Sampling简单总结

Gibbs Samping 是MCMC中最常用的方法，基本的原理就是构造一条马尔可夫链，已知变量间的条件概率，求变量的联合概率分布。通常若按数学公式是可以直接求出联合概率的，但随着变量数量的增大，公式求解，变得异常复杂，遂通过采样的方式求得联合概率分布。基本过程:比如我们已知变量A，B，C，并知p(A|B,C),p(B|A,C),p(C|A，B)，step1：给ABC随机赋值，即随

2014-03-15 18:34:38 1107

转载 [Java]读取文件方法大全

转自http://www.cnblogs.com/lovebread/archive/2009/11/23/1609122.html[Java]读取文件方法大全1、按字节读取文件内容2、按字符读取文件内容3、按行读取文件内容4、随机读取文件内容 public class ReadFromFile { /** * 以字节为

2014-03-12 03:42:28 615

转载贝叶斯网络应用实例一：胸部疾病诊所

转自：http://blog.sciencenet.cn/blog-82650-255141.html 以下内容摘录自www.norsys.com，根据实例内容意译译文。贝叶斯网络应用实例一：胸部疾病诊所（Chest Clinic）假想你是Los Angeles一名新毕业的医生，专攻肺部疾病。你决定建立一个胸部疾病诊所，主治肺病及相关疾病。大学课本已经中告诉你了肺癌、肺结核

2014-03-11 20:04:34 5942

原创 csdn牛人太多

csdn的牛人太多了，好东西也太多了，可是看了消化之后，最好自己能做些笔记，这样便于之后忘记的时候迅速的复习回忆！希望我之后也能添些新东西进去。最近在看有关LDA隐含狄利克雷分布和Gibbs采样以及概率图模型，概念不是太清晰，有些模糊，还是没太明白，LDA到底是干嘛用的，还有就是LDA建模哪个是已知的量，可以求出哪个量？没太懂！继续探求！

2014-03-04 02:22:02 744

suejl的专栏