- 博客(4)
- 收藏
- 关注
转载 先验概率、后验概率与似然估计
先验概率、后验概率与似然估计本文假设大家都知道什么叫条件概率了(P(A|B)表示在B事件发生的情况下,A事件发生的概率)。先验概率和后验概率教科书上的解释总是太绕了。其实举个例子大家就明白这两个东西了。假设我们出门堵车的可能因素有两个(就是假设而已,别当真):车辆太多和交通事故。堵车的概率就是先验概率 。那么如果我们出门之前我们听到新闻说今天路上出了个交
2014-11-23 17:03:27 818
转载 perl 文件操作
perl中文件操基础 在Perl中,提供了三种文件句柄:STDIN,STDOUT,STDERR.它们可以由父进程建立的文件或者设备会自动打开.一般使用open函数来建立文件句柄.open函数的语法是只读模式时为: open (FILEHANDLE,"somename"); 其中FILEHANDLE是文件句柄的名字,常用写法是全部大写字母(没有特殊规则,没有特殊前缀).
2014-11-19 20:16:28 818
转载 信息增益 特征选择
前文提到过,除了开方检验(CHI)以外,信息增益(IG,Information Gain)也是很有效的特征选择方法。但凡是特征选择,总是在将特征的重要程度量化之后再进行选择,而如何量化特征的重要性,就成了各种方法间最大的不同。开方检验中使用特征与类别间的关联性来进行这个量化,关联性越强,特征得分越高,该特征越应该被保留。在信息增益中,重要性的衡量标准就是看特征能够为分类系统带来多少信息,带
2014-11-12 16:06:21 1227 1
转载 hadoop stream
1 hadoop streaming[html] view plaincopyHadoop streaming是和hadoop一起发布的实用程序。它允许用户创建和执行使用任何程序或者脚本编写的map或者reduce的mapreducejobs。譬如, $HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/ha
2014-11-06 15:13:11 992
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人