Stay hungry, Stay foolish

新浪微博: Ralph_adu

主题模型-LDA浅析

上个月参加了在北京举办SIGKDD国际会议,在个性化推荐、社交网络、广告预测等各个领域的workshop上都提到LDA模型,感觉这个模型的应用挺广泛的,会后抽时间了解了一下LDA,做一下总结: (一)LDA作用         传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,...

2012-09-03 14:09:24

阅读数:222273

评论数:34

频繁项集挖掘算法之FPGrowth

背景:         频繁项集挖掘算法用于挖掘经常一起出现的item集合(称为频繁项集),通过挖掘出这些频繁项集,当在一个事务中出现频繁项集的其中一个item,则可以把该频繁项集的其他item作为推荐。比如经典的购物篮分析中啤酒、尿布故事,啤酒和尿布经常在用户的购物篮中一起出现,通过挖掘出啤酒...

2014-01-01 22:30:23

阅读数:41553

评论数:6

Weka中的ARFF文件

Weka中用的ARFF文件格式分为两部分:Header 和Data。其中Header部分用于定义Relation的名字、一系列Attribute的名字和类型,比如: @RELATION iris @ATTRIBUTE sepallength NUMERIC @ATTRIB...

2012-12-13 17:00:18

阅读数:7452

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭