机器学习
chanyuen
对嵌入式平台和机器学习感兴趣,并在这领域中少有成果。本科取得全国嵌入式设计比赛特等奖,与导师共著嵌入式设计相关的书一本。硕士研习人工智能,发表过多篇论文,提出了Background Net与Personalized Keywords等概念,可用于个性化搜索。
展开
-
找出词与词之间的关联(association relationship/rule)
<br />关联规则可能是看数据挖掘书的第一个topic。很多的书也会举一个卖尿片的例子,有兴趣的朋友上网找找吧,很经典。我下面要说的是我现在搞的研究,词语之间的关联(association relationship between words)。我们都知道词语是有语意的(semantic meaning),如果我们想把词A与词A'区分开的话,我们就要明确这两个词的semantic meaning。<br /> <br />比如说:<br />苹果与梨子是不同的,为什么不同呢,苹果比梨子圆些;苹果是红色或绿原创 2011-04-06 23:08:00 · 1613 阅读 · 0 评论 -
理解shannon信息论中的自信息量
<br />看了好多书,自信息量只是直接给出公式,也没有说明这公式是如何来的。我觉得会有不少人一看到有log的出现就已经怕了,不会再往下看,其实自己推一下,就知道,其实原来是这样的意思。<br /> <br /><br /> <br />怕了吧,又有log,又有负号,其实如果直接看这条式子,还真不知自信息量是什么意思,那我们推一推:<br /><br /> <br />看到了吧,其实不太难的高中数学就可以了。要说明一下,10是什么,I(a),P(a)又是什么? I(a),其实不用说了,它就是我们要求的东西,原创 2011-04-08 08:45:00 · 2192 阅读 · 0 评论