Journals
ACM TKDD
http://tkdd.cs.uiuc.edu/
ACM TODS
http://www.acm.org/tods/
VLDB Journal
http://www.vldb.org/
ACM Tois
http://www.acm.org/pubs/tois/
Conferences
SigKDD
http://www.sigkdd.org/
VLDB
http://www.vldb.org/
SigMod
http://www.acm.org/sigmod/
Online Resources
A google co-op search engine for Data Mining
Data Mining, University of Houston
Data Mining Program, University of Central Florida
http://dms.stat.ucf.edu/
Data Mining Group, University of Dortmund
http://www-ai.cs.uni-dortmund.de/index.html
Data Mining, MIT OCW
Data Mining Group, Tsinghua
http://dbgroup.cs.tsinghua.edu.cn/dmg.html
KDD oral presentations video
http://www.videolectures.net
Tools
IlliMine
http://illimine.cs.uiuc.edu/
Alpha Miner
http://www.eti.hku.hk/alphaminer
Potter's Wheel A-B-C
http://control.cs.berkeley.edu/abc/
分析:
一流的:
数据库三大顶级会议
SIGMOD
,
VLDB
,
ICDE
,数据挖掘
KDD
,实际相关的还有机器学习
ICML,
还有信息检索的
SIGIR
;数据库的理论会议
PODS
。
二流的:
EDBT
,
ICDT
,
CIKM
,
SDM
,
ICDM
,
PKDD
,还有
ECML
欧洲的机器学习会议(这个应该是
1.5
档的,比一般的二流好)
SIGMOD
:
97
分,数据库的最高会议,涉及范围广泛,稍偏应用(因为理论文章有
PODS
)。没说的,景仰如滔滔江水。这个会议不仅是
double-blind review
,而且有
rebuttal procedure
,可谓独树一帜,与众不同。
VLDB
:
95
分,非常好的数据库会议。与
SIGMOD
类似,涉及范围广泛,稍偏应用。
从文章的质量来说,
SIGMOD
和
VLDB
难分伯仲,没有说谁比谁更高。他们的范围也几乎一样。不少牛人都认为,今年的
rebuttal procedure
其实并不怎么成功。投稿太多,很难做到每一篇都公平公正。很多
rebuttal
没人看。
double-blind
是把双刃剑。这几年来每年都有人冒充牛人的风格来投稿,有的还真进去了。反而
VLDB
的审稿质量一直很高。每年的
VLDB
都有很理论的
paper
。
一般来说,我感觉大家还是认为
SIGMOD
要好那么一点点。根据我个人读过的文章,也有这样的感觉。不过这个并不重要了,有差别也是那么一点。
PODS
:
95
分。是
“
数据库理论的最好会议
,
也是一个很好的理论会议
”
。每年总是
co-located with SIGMOD
。感觉其中算法背景的人占主流(你可以数数
PODS
文章中有多少来自
Motwani group
),也有一部分
AI
背景的人(毕竟
SIGART
也是主办者之一)。它的影响力远不及
SIGMOD
,然而其中文章的质量比较整齐,
variance
小于
SIGMOD
(以及其他任何数据库会议)。有一位牛人说:
“PODS never had a really bad paper
,
”
这是它值得骄傲的地方。
KDD:
:
full paper 95
分,
poster/short paper 90
分。数据挖掘的最高会议。由于历史积累不足以及领域圈子较小,勿用讳言
KDD
目前比
SIGMOD
尚有所不如。我觉得我们可以这样类比:
KDD:SIGMOD=CRYPTO:STOC
。
回顾密码学的历史,真正最牛的文章一般发在
STOC/FOCS
而非
CRYPTO/EUROCRYPT
,这和今天的数据挖掘何等类似!然而你看看今天的密码学文章,已经有顶级的密码学家(恕我不便写出名字)不再往
STOC/FOCS
投稿。我觉得同样的事情在不久的将来也会发生在数据挖掘中,让我们拭目以待。
这几年来
KDD
的质量都很高。其
full paper
的质量高于
SIGMOD/VLDB
中数据挖掘方面的
paper
的质量。原因是
SIGMOD/VLDB
审稿人中数据挖掘的人很少,审稿标准不一定能掌握得很好。
这几年好几篇
SIGMOD/VLDB
的数据挖掘
paper
都
follow
一些
KDD
的
paper
。而在
KDD
,要拿一篇
full paper
真难。去年复旦拿了一篇,实属难能可贵。今年他们又拿了一个
SIGMOD demo
,说明工作的确很扎实。
听说在很多地方,如果能有一篇
SIGMOD/VLDB/KDD
,就能博士毕业,能有两篇就能找到不错的工作。
“
革命尚未成功,同志仍需努力!
”
ICDE
:
92
分。很好的数据库会议,也是一个大杂烩。好处是覆盖面广、包容性强,坏处是文章水平参差不齐。
EDBT
:
88
分,不错的数据库会议,录取率很低然而历史积累不足,影响还明显不及
ICDE
。
ICDT
:
88
分,
PODS
的欧洲版,数据库理论第二会议。
和
SIGMOD/VLDB
一样,
ICDE
和
EDBT
在质量和影响上都不相上下。其它的如
CIKM
,
ICDM
,
SDM
,
SSDBM
,
PKDD
等等都比以上的会议差一截。
CIKM
:
85
分。
SDM
:
full paper 90
分,
poster/short paper 85
分。
SIAM
的数据挖掘会议,与
ICDM
并列为数据挖掘领域的第二位,比
KDD
有明显差距。好像其中统计背景的人比较多,也有一部分机器学习背景的人,比较
diversified
。
ICDM
:
full paper 90
分,
poster/short paper 85
分。
IEEE
的数据挖掘会议,与
SDM
并列为数据挖掘领域的第二位,比
KDD
有明显差距。
PKDD
:
83
分(因为
poster/short paper
数量很少,所以不予区分)。好像是
KDD
的欧洲版,但与
KDD
差距很大。