自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (6)
  • 收藏
  • 关注

转载 relief

<br />Relief [generation=heuristic, evaluation=distance].•Basic algorithm construct :- each feature is assigned cumulative weightage   computed over a predefined number of sample data set    selected from the training data set.- feature with weightag

2011-03-31 22:42:00 1064

原创 weka: FCBFSearch

paper:Feature Selection for High-Dimensional Data: A Fast Correlation-Based Filter Solution.Feature selection method based on correlation measure and relevance redundancy analysis. Use in conjunction with an attribute set evaluator通过对特征集的相关性 以及 冗余分析做评价//TO

2011-03-31 18:22:00 2295

原创 weka: exhaustive search

穷举搜索。假设10个属性, 需要找出2^^10 种可能情形中, 那种的merit最优。每次直接根据迭代次数space产生属性集code: //best_group 初始为空 //best_merit初始为空best_group的merit //假设有10个属性, 那么需要搜索 2^^10 - 1 = 1023 次 BigInteger searchSpaceEnd = BigInteger.ONE.add(BigInteger.ONE).pow

2011-03-31 17:41:00 2322

原创 weka: backwards with delete

<br />paper:<br />Mark Hall, Eibe Frank: Combining Naive Bayes and Decision Tables. In: Proceedings of the 21st Florida Artificial Intelligence Society Conference (FLAIRS)<br /> <br /> <br />code:<br />// best_group初始包含所有属性 // main search loop b

2011-03-31 17:27:00 866

原创 weka: best first search

ASSearch                 搜索算法类ASEvaluation              特征结果集评价算法类。该类有接口接受样本输入AttributeEvaluation        单个特征的评价类AttributeSetEvaluation    特征集的评价类AttributeSelection          特征选择类,接受ASSearch与ASEvaluation作为输入AttributeTransformer     数据转换类Best First Search:m

2011-03-31 16:46:00 4313 2

原创 em notes

零<br />K 类个数, M term个数, N doc个数。<br /> <br /> <br /> 一<br /><br /><br />qmk是term m在类k中出现的概率。<br />16.14式的左边含义就是在模型未知参数theta的情况下,类k中包含文档d的概率<br />右边就是d内的所有term出现在类k中的概率连乘积,与d内未出现的term的补(1-q)的连乘积<br /> <br /> <br /> 二<br /> <br /><br />和16.14式不同的是,无wk了。<br /

2011-03-30 17:10:00 729

原创 贝叶斯与门后奖

链式法则 P(A, B) = P(A交B) = P(A|B)*P(B) = P(B|A)*P(A)分划        P(B) = P(A, B) + P(A', B)       A'为A的补贝叶斯: P(A|B) = P(B|A)P(A)/P(B) = [P(B|A)/(sigmaP(B|X)P(X))]*P(A); x为A ,A'其中P(A)为先验概率, P(A|B)为当B发生后A的后验概率; P(B|A)称为A发生情况下B的likelihood某节目, 三个门 xyz, 只有一个门后面有奖品。 选手

2011-03-23 15:38:00 1204 1

原创 向量的导数

<br />由向量导数的定义,若向量函数f=(f1,f2,...fn)在点θ(θ1,θ2,...θm)处可导,则其导数为一个矩阵: <br />                #(f1,θ1)       #(f1,θ2)   ...   #(f1,θm) <br />                #(f2,θ1)       #(f2,θ2)   ...   #(f2,θm) <br />                ................................ <br />   

2011-03-22 18:04:00 1930

原创 转 LDA入门

<br />http://blog.csdn.net/warmyellow/archive/2010/04/06/5454943.aspx

2011-03-21 17:20:00 530

原创 转 LDA入门

<br />LDA算法入门<br /> <br />一. LDA算法概述:<br />线性判别式分析(Linear Discriminant Analysis, LDA),也叫做Fisher线性判别(Fisher Linear Discriminant ,FLD),是模式识别的经典算法,它是在1996年由Belhumeur引入模式识别和人工智能领域的。性鉴别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小

2011-03-21 17:20:00 1102 1

原创 LSA

http://blog.csdn.net/aalbertini/archive/2011/03/18/6259066.aspx1) 将Term Document矩阵进行svd, 得到 TSD'      2) 对于新文档构成的列向量Q, 计算其文档坐标 Dq=Q'TS"3) Dq 与 DS的行向量计算夹角, 判断距离因此看, LSA的作用是进行相关性判断SVD的作用: 降维。 降维的同时达到了潜在语义索引的目的。SVD、降维之后得到近似term document矩阵AA*A'中的元素(i,j)表示第i个te

2011-03-18 17:26:00 974 1

原创 特征提取 notes

<br />特征获取<br />    从N个特征集合中选择M个特征的子集, 并满足M<=N<br />    1, 特征提取:是一种变换,将处于高位空间的样本通过映射或变换的方式转换到低维空间,达到降维目的<br />    2, 特征选择:从一组特征中去除冗余或不相关的特征来降维<br />    二者通常结合使用, 如先映射到低维空间、再去除冗余和不相关特征<br />    <br />特征获取的两个问题<br />    1, 确定选择算法: 在允许时间内, 找出最小的、最能描述类别的特征组合<b

2011-03-18 16:01:00 2455

原创 dm 重要资料链接

cnblogs leftnoteasyhttp://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.htmlforever albumhttp://foreveralbum.yo2.cn/articles/latent-semantic-analysis-note.html

2011-03-18 14:53:00 773

原创 SVD notes

1 特征值与特征向量 A * vi = li * vi, 则称vi为A的特征向量, li为该特征向量对应的特征值。 vi为列向量。若vi点乘vi、 vi'*vi 结果为1,则称vi为单位特征向量  若一组正交的单位特征向量vi, i from 1 to n, 构成矩阵V = {v1 v2 ... vn}  A * V = {Av1  Av2  ... Avn}        = {l1v1 l2v2 ... lnvn}        = {v1   v2   ... vn} * D, D是n*n的对角矩阵,

2011-03-18 14:51:00 3761 1

原创 svd好文

转载

2011-03-17 18:12:00 1597

原创 pca 特征抽取

主成分分析 ( Principal Component Analysis , PCA )是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。给定 n 个变量的 m 个观察值,形成一个 n ′ m 的数据矩阵, n 通常比较大。对于一个由多个变量描述的复杂事物,人们难以认识,那么是否可以抓住事物主要方面进行重点分析呢?如果事物的主要方面刚好体现在几个主要变量上,我们只需要将这几个变量分离出来,进行详细分析。但

2011-03-17 16:21:00 9046 2

原创 KL变换

<br />K-L变换1.K-L变换的定义<br />  以矢量信号X的协方差矩阵Ф的归一化正交特征矢量q所构成的正交矩阵Q,来对该矢量信号X做正交变换Y=QX,则称此变换为K-L变换(K-LT或KLT),K-LT是Karhuner-Loeve变换的简称,有的文献资料也写作KLT。可见,要实现KLT,首先要从信号求出其协方差矩阵Ф,再由Ф求出正交矩阵Q。Ф的求法与自相关矩阵求法类似。 2.K-L变换的特性<br />  (1)去相关特性。 <br />  K-L变换是变换后的矢量信号Y的分量互不相关。 <b

2011-03-17 16:09:00 18354 2

原创 KL距离 相对熵

<br />比如利用相对熵进行分类或者是利用相对熵来衡量两个随机分布的差距,当两个随机分布相同时,其相对熵为0.当两个随机分布的差别增加时,器相对熵也增加。我们下面的实验是为了横量概率分布的差异。方法:<br />D(p//q)=sum(p(x)*log(p(x)/q(x)))。其中p(x)和q(x)为两个概率分布<br />约定 0*log(0/q(x))=0;p(x)*log(p(x)/0)=infinity;<br /> <br />D(p//q) 与 D(q//p) 无对称性

2011-03-17 16:04:00 6564 1

原创 valgrind

<br />valgrind --tool=memcheck --leak-check=full app appargs<br /> <br />检测内存泄露, 检测不了so中的内存泄露。。???<br />=====从我的一次经历中可以得出该结论。<br />我调用了一个so, valgrind整个程序没问题, 但是内存一直涨; 注掉该so 一切ok 无内存问题

2011-03-14 10:11:00 744

原创 vector notes

<br />struct _Vector_base<br />{<br />public:<br />      _Vector_impl _M_impl;<br />};<br /> <br />struct _Vector_impl : public _Tp_alloc_type         _Vector_impl类时从alloc继承的<br /> <br />class vector : protected _Vector_base<_Tp, _Alloc>   vector从base类继承。<

2011-03-11 14:37:00 654

转载 libevent

<br />libevent事件处理框架分析这两天大致看了看libevent的代码,简单做一个分析.libevent最大的特点就是封装了对以下三种事件的响应:IO事件,定时器事件,信号事件.这里就分析libevent如果做到这一点的,在libevent中还包括一些其他的功能(如缓冲区),但是我这里就重点讲解这一部分了.事件原型,简单看一看用于封装事件的结构体定义:struct event { TAILQ_ENTRY (event) ev_next; TAILQ_ENTRY

2011-03-11 00:01:00 1646

转载 memcache nginx

反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个服务器。    通常的代理服务器,只用于代理内部网络对Internet的连接请求,客户机必须指定代理服务器,并将本来要直接发送到Web服务器上的http请求发送到代理服务器中。由于外部网络上的主机并不会配置并使用这个代理服务器,普通代理服务器也被设计为在Internet上搜寻多

2011-03-10 23:39:00 2309 2

原创 gdb调试: 多线程-宏-条件断点

gdb

2011-03-09 14:25:00 1799 1

原创 bdb 读取

<br />#include <db_cxx.h>#include <string>#include <iostream>using namespace std;int main(int argc, char *argv[]){ if(argc != 2) { cerr <<"err args: cmd filename/n"; return -1; }

2011-03-04 15:43:00 696

go 深入cgo编程

go使用cgo的深入文档介绍。 go使用者学习必备。㊗️各位大佬愉快进步

2019-04-25

二维码识别 c++ 库

linux c++ 二维码图像生成与识别。 linux平台下,绝对放心可用

2019-04-25

leetcode book pdf 中文

按算法考察类型, 对题目进行了归纳。 新手练习, 或者找工作必备用书。 ㊗️各位大佬顺利

2019-04-25

scala 编程 中文版 pdf

scala 编程 中文版 pdf 欢迎下载。 scala 在 spark 中应用较广

2019-03-28

aws 运维文档

aws 运维文档, 对服务器端开发、运维工作都非常有帮助

2019-03-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除