数据挖掘相关

数据挖掘顶级会议
ICML,ICIP,ICCV,IJCAI,ICIAP,CAIP,KDD,NIPS,SIGIR,TKDE,ECML,AAAI

ICML: international conference of machine learning

ICIP: international conference on image processing

ICCV: international conference on computer vision

iccv: ICCV”是“International Conference on Computer Vision”的简称。该会议由美国电气和电子工程师学会(IEEEInstitute of Electrical & Electronic Engineers)主办,通常是在北美、欧洲、亚洲的一些科研实力较强的国家举行。作为世界顶级的学术会议,首届国际计算机视觉大会于1987年在伦敦揭幕,其后两年举办一届。

计算机视觉是当前计算机科学研究的一个非常活跃的领域,该学科旨在为计算机和机器人开发出具有与人类水平相当的视觉能力。各国学者对于计算机视觉的研究始于20世纪60年代初,但相关基础研究的大部分重要进展则是在80年代以后取得的。近年来,全球学界愈来愈关注中国人在计算机视觉领域所取得的科研成就,这是因为由中国人主导的相关研究已取得了长足的进步——2007年大会共收到论文1200余篇,而获选论文仅为244篇,其中来自中国大陆,香港及台湾的论文有超过30篇,超过大会获选论文总数的12%

IJCAI: international joint conference on artificial intelligence

ICIAP: international conference on image analysis and processing

CAIP: computer analysis on image and patterns

KDD: knowledge discovery in databases

知识发现(KDDKnowledge Discovery in Databases)是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。

数据库知识发现(knowledse discovery in databasesKDD)的研究非常活跃。该术语于1989年出现,Fayyad定义为"KDD"是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程”。在上面的定义中,涉及几个需要进一步解释的概念:“数据集”、“模式”、“过程”、“有效性”、“新颖性”、“潜在有用性”和“最终可理解性”。数据集是一组事实 F(如关系数据库中的记录)。模式是一个用语言L来表示的一个表达式E,它可用来描述数据集F的某个子集凡上作为一个模式要求它比对数据子集FE的枚举要简单(所用的描述信息量要少)。过程在KDD中通常指多阶段的处理,涉及数据准备、模式搜索、知识评价以及反复的修改求精;该过程要求是非平凡的,意思是要有一定程度的智能性、自动性(仅仅给出所有数据的总和不能算作是一个发现过程)。有效性是指发现的模式对于新的数据仍保持有一定的可信度。新颖性要求发现的模式应该是新的。潜在有用性是指发现的知识将来有实际效用,如用于决策支持系统里可提高经济效益。最终可理解性要求发现的模式能被用户理解,目前它主要是体现在简洁性上。有效性、新颖性、潜在有用性和最终可理解性综合在一起称为兴趣性。

由于知识发现是一门受到来自各种不同领域的研究者关注的交叉性学科,因此导致了很多不同的术语名称。除了 KDD外,主要还有如下若干种称法:“数据挖掘”(data mining),“知识抽取”(information extraction)、“信息发现”(in1ormation discovery)、“智能数据分析”(intelligent data analysis)、“探索式数据分析”(exploratory data analysis)、“信息收获”(Information harvesting)和“数据考古”(data archaeology)等等。其中,最常用的术语是“知识发现”和“数据挖掘”。相对来讲,数据挖掘主要流行于统计界(最早出现于统计文献中)、数据分析、数据库和管理信息系统界;而知识发现则主要流行于人工智能和机器学习界。
 

NIPS: Neural Information Processing Systems

Neural Information Processing Systems (NIPS) is a machine learning and computational neuroscience conference held every December in Vancouver

找到一个nips会议历年(1987-2008)文献的下载地址,很不错的 
http://books.nips.cc/ 
下面是会议的一些简介 
NIPS (1): 神经计算方面最好的会议之一, NIPS主办, 每年举行. 值得注意的是, 这个会每年的举办地都是一样的, 以前是美国丹佛, 现在是加拿大温哥华; 而且它是年底开会, 会开完后第2年才出论文集, 也就是说, NIPS'05的论文集是06年出. 会议的名字是"Advances in Neural Information Processing Systems", 所以, 与ICML/ECML这样 的"标准的"机器学习会议不同, NIPS里有相当一部分神经科学的内容, 和机器学习有 一定的距离. 但由于会议的主体内容是机器学习, 或者说与机器学习关系紧密, 所以不少人把NIPS看成是机器学习方面最好的会议之一. 这个会议基本上控制在Michael  Jordan的徒子徒孙手中, 所以对Jordan系的人来说, 发NIPS并不是难事, 一些未必很 强的工作也能发上去, 但对这个圈子之外的人来说, 想发一篇实在很难, 因为留给"外人"的口子很小. 所以对Jordan系以外的人来说, 发NIPS的难度比ICML更大. 换句话说, ICML比较开放, 小圈子的影响不象NIPS那么大, 所以北美和欧洲人都认, 而NIPS则有 些人(特别是一些欧洲人, 包括一些大家)坚决不投稿. 这对会议本身当然并不是好事,  但因为Jordan系很强大, 所以它似乎也不太care. 最近IMLS(国际机器学习学会)改选理事, 有资格提名的人包括近三年在ICML/ECML/COLT发过文章的人, NIPS则被排除在外了. 无论如何, 这是一个非常好的会.

SIGIR: Special Interest Group on Information Retrieval

TKDE: transactions on knowledge and data engineering

CVPR: computer vision and pattern recognition

ECML: European Conference on Machine Learning

AAAI: Association for the Advancement of Artificial Intelligence

from:http://hi.baidu.com/zonenic/blog/item/2bb39b44a2912b85b3b7dc7f.html

http://bbs.sciencenet.cn/showtopic-54535.aspx  



关于KDD详细介绍
ACM SIGKDD数据挖掘及知识发现会议1 
清华大学计算机系   王建勇 
 
1、 KDD概况 
ACM SIGKDD国际会议(简称KDD)是由ACM的数据挖掘及知识发现专委会[1]主办的数据挖掘研究领域的顶级年会。它为来自学术界、企业界和政府部门的研究人员和数据挖掘从业者进行学术交流和展示研究成果提供了一个理想场所,并涵盖了特邀主题演讲(keynote presentations)、论文口头报告(oral paper presentations)、论文展板展示(poster sessions)、研讨会(workshops)、短期课程(tutorials)、专题讨论会(panels)、展览(exhibits)、系统演示(demonstrations)、KDD CUP赛事以及多个奖项的颁发等众多内容。由于KDD的交叉学科性和广泛应用性,其影响力越来越大,吸引了来自统计、机器学习、数据库、万维网、生物信息学、多媒体、自然语言处理、人机交互、社会网络计算、高性能计算及大数据挖掘等众多领域的专家、学者。KDD可以追溯到从1989年开始组织的一系列关于知识发现及数据挖掘(KDD)的研讨会。自1995年以来,KDD已经以大会的形式连续举办了17届,论文的投稿量和参会人数呈现出逐年增加的趋势。2011年的KDD会议(即第17届KDD年会)共收到提交的研究论文(Research paper)714篇和应用论文(Industrial and Government paper)73篇,参会人数也达到1070人。下面我们将就会议的内容、历年论文投稿及接收情况以及设置的奖项情况进行综合介绍。此外,由于第18届KDD年会将于2012年8月12日至16日在北京举办,我们还将简单介绍一下KDD’12[4]的有关情况。 
 
2、 会议内容 
自1995年召开第1届KDD年会以来,KDD的会议内容日趋丰富且变的相对稳定。其核心内容是以论文报告和展版(poster)的形式进行数据挖掘同行之间的学术交流和成果展示。KDD录用的论文以研究论文为主、辅以一定数量的应用论文,以及少量的系统演示论文。依附于KDD年会的KDD CUP竞赛也是会议的一项重要内容。此外,会议还包括特邀主旨报告(keynote presentations)、辅导报告(tutorials)、专题讨论(panels)、研讨会(workshops)以及工业实践及展览(Industrial practice expo track)等内容。 
 
1. 研究主题(Research Track) 
    每年的KDD年会结束后不久,来年的会议组织者会发布论文征文通知。征文通知中会列出论文的各种投稿要求,包括会议感兴趣的主题、评价标准以及格式等。从KDD’12官方网站的征文通知[5]可以了解到,KDD’12感兴趣的研究类主题主要包括关联分析(association analysis)、分类与回归分析算法(classification and regression methods)、半监督式学习(semi-supervised learning)、聚类(clustering)、因式分解(factorization)、迁移学习和多任务学习(transfer and multi-task learning)、特征选择(feature selection)、社会网络(social networks)、图数据挖掘(mining of graph data)、时空数据分析(temporal and spatial data analysis)、可扩展性(scalability)、隐私保护(privacy)、安全性(security)、可视化(visualization)、文本分析(text analysis)、万维网挖掘(Web mining)、移动数据挖掘(mining mobile data)、推荐系统(recommender systems)、生物信息学(bioinformatics)、电子商务( e-commerce)、在线广告(online advertising)、异常检测(anomaly detection)、以及针对大数据的知识发现(knowledge discovery from big data)等。论文的评价标准主要包括新颖性(novelty)、技术质量(technical quality)、影响力(potential impact)、论文表达的清晰度(clarity of writing)等指标。 
会议期间,KDD研究论文报告按照主题会被分成了若干个分会(session),被录用论文的作者在相应的分会做报告。以KDD 2011[6]为例,该年会的分会主题包括分类(Classification)、矩阵分解(Matrix factorization)、图分析(Graph analysis)、Web用户建模(Web user modeling)、用户建模(User modeling)、在线数据和数据流(Online data and streams)、文本挖掘(Text mining)、隐私保护(Privacy)、社会网络(Social networks)、理论(Theory)、频繁集(Frequent sets)、非监督式学习(Unsupervised learning)、图挖掘(Graph mining)、可扩展性(Scalability)和可预测建模(Predictive modeling)。 
 
2. 应用主题(Industrial and Government Track) 
应用主题类论文的发表和作者的与会报告是KDD年会的重要组成部分,也是KDD相对于很多其他会议的特色之一。由于数据挖掘的广泛应用性,应用主题类论文受到数据挖掘研究人员和开发者的重视。相对于很多其他会议,KDD应用主题类论文的征文启事和录取更为规范。从KDD’12官方网站的征文通知[5]可以看出,该年会的企业及政府应用主题征求描述针对企业和政府部门数据挖掘解决方案的论文投稿,并特别欢迎某些在数据挖掘技术应用过程中能够促进某些实际问题的理解或提出新的挑战性研究问题的论文。KDD应用主题类论文涉及的应用领域主要包括电子商务、医疗、国防、公共政策、财务、工程、环境、制造业、电信、政务等。被KDD录用的应用主题类论文又被分为以下3大类: 
 对企业、政府或其他机构带来实际价值的数据挖掘系统 
 对企业、政府或其他用户(例如科学研究或医疗行业)带来显著价值的知识发现  有潜力带来价值的前沿应用和技术  

3. KDD CUP竞赛 
    KDD CUP是ACM SIGKDD[1]组织的有关数据挖掘和知识发现领域的年度赛事。作为KDD年会的重要组成部分,自1997年以来已经连续举办了15届,目前是数据挖掘领域最有影响力的赛事。 通常每年在KDD会议网站上会公布当年的KDD CUP主题及各个子任务、数据集、考核指标等。全世界的数据挖掘参赛者在规定时间内提交解决方案和结果。优胜者名单会在KDD CUP网站公布,并在会议期间颁奖。纵观历年的KDD CUP赛事,我们不难发现其主题的多样性。往届的KDD CUP任务涉及到面向利润(升力曲线)优化的直接营销、计算机网络入侵检测、在线零售网站点击流分析、分子生物活性和现场蛋白质预测、生物医学文档和基因角色分类、网络挖掘与用户日志分析、粒子物理学和同调蛋白质预测、互联网用户搜索查询分类、基于图像数据的肺栓塞检测、客户推荐、乳腺癌、客户关系预测、学生成绩评估、以及基于雅虎音乐数据集的音乐推荐等众多领域。在往届的KDD CUP竞赛中,某些华人组成的参赛队伍也曾取得了不俗的成绩。例如,KDDCUP史上首次包揽了全部子项目冠军的团队就来自香港科大,其队员包括Dou Shen(沈抖)、Rong Pan、Jiantao Sun、Junfeng Pan、Kangheng Wu、Jie Yin、Qiang Yang(杨强)。 
 
4. 系统演示(Exhibit and Demo Track) 
KDD会议设有一个系统演示分会场,用于让数据挖掘研究人员或从业者以交互的方式向与会者展示他们所开发的数据挖掘软件系统(或组件)的设计理念、实现技巧以及功能等。 

5. 工业实践展(Industry Practice Expo Track) 
工业实践展是KDD从2011年开始新增加的一部分会议内容,主要由特邀报告和专题讨论组成。其主要目的是召集一流的业界或政府部门的数据挖掘实践者和与会者共享他们的一些有关数据挖掘应用的体会和经验。 
 
6. 专题研讨会(Workshops) 
同其它会议类似,KDD也设有专题研讨会,其目的是就某些热门或前沿主题让数据挖掘研究人员有机会来交流新颖的研究想法。KDD’11[6]共设了16个主题研讨会。 
 
7. 专题讨论会(panels) 
KDD专题讨论会是就数据挖掘领域的某个重要的话题邀请几个相关的知名专家阐述自己的观点,并通过与参会者的互动来对该话题开展深入的研讨。KDD’11[6]的专题讨论主题为“来自数据挖掘竞赛的经验教训”(Lessons Learned from Contests in Data Mining)。 
 
8. 短期课程(tutorials) 
每年的KDD年会都会就几个数据挖掘主题邀请这些领域的知名专家细致地讲解与该主题相关的问题、研究背景、主要的解决方案等内容。通常每个课程的时间是半天或一天。 
 
9. 特邀主题报告(keynote presentations) 
每年的KDD年会都会邀请在某些数据挖掘领域做出卓越成绩的专家学者做主题报告。以KDD’11[6]为例,会议共邀请了4位特邀主题发言人,他们分别是:美国斯坦福大学电子工程系教授Stephen Boyd、Google公司研究主管Peter Norvig、美国加州大学圣克鲁兹分校分子生物工程系教授David Haussler以及加州大学洛杉矶分校计算机系教授Judea Pearl。 
 
表1、2003-2011年期间KDD研究论文投稿及录取情况(注:自2007年以来论文不再区分 长、短文,表中2007年以后的长、短文对应的分别是长报告和短报告)
 




3、 历年论文投稿及接收情况 
我们对2003年以来KDD的研究类论文和应用类论文的投稿、录取率等进行了统计(注:数据来自历年KDD会议的论文集)。发现研究类论文的投稿量呈现逐年增加的趋势,而论文总的录取率(即包括长、短文所有被录取论文的录取率)相对稳定,基本在17%至19%左右徘徊。具体的分析结果见表1。 
相对于研究类论文,应用类论文的投稿量少且相对稳定,其录取率相对更高,基本在30%左右。具体统计结果见表2。 
此外,图1和图2分别对比了KDD研究类论文和应用类论文的总录取率和投稿量。  
表2、2003-2011年期间KDD应用(Industrial and Government)论文投稿及录取情况 
 
图1、2003年-2011年期间KDD的研究论文、应用论文各自的总录取比率 

 
图2、2003年-2011年期间KDD的研究论文、应用论文投稿情况 
 
4、 设置的奖项情况 
在每年的KDD年会上颁发的主要奖项包括SIGKDD创新奖(SIGKDD Innovation Award)、SIGKDD服务奖(SIGKDD Service Award)、SIGKDD最佳研究论文奖(SIGKDD Best Research Paper Award)、SIGKDD最佳应用论文奖(SIGKDD Best Application Paper Award)、SIGKDD博士论文奖(SIGKDD Doctoral Dissertation Award)以及SIGKDD学生差旅奖(SIGKDD Student Travel Award)[3]。 
1、 SIGKDD创新奖(SIGKDD Innovation Award) 
该奖主要用于奖励对数据挖掘及知识发现领域作出重大技术贡献的研究人员,获奖人员的研究工作通常在数据挖掘理论或商业数据挖掘系统开发上产生了持久的影响。自2000年以来已有11位数据挖掘研究人员获此殊荣,其中来自UIUC的韩家炜教授位列其中。  
2、 SIGKDD服务奖(SIGKDD Service Award) 
该奖主要奖励对数据挖掘及知识发现领域作出重大服务贡献的个人或团队,考察的因素主要包括主持学术团体、主办会议等服务性工作、数据挖掘教学、财务赞助等。自2000年以来已产生了10位获奖者,其中包括来自美国佛蒙特大学的吴信东教授。  
3、 SIGKDD最佳研究论文奖(SIGKDD Best Research Paper Award) 
该奖主要用于奖励从每年的KDD年会所录用的研究论文中挑选出来的、对数据挖掘和知识发现领域有基础性的推动作用的论文。KDD的研究论文奖包括最佳研究论文奖(Best Research Paper Award)和最佳学生论文奖(Best Student Paper Award)两类。  
4、 SIGKDD最佳应用论文奖(SIGKDD Best Application Paper Award)。 
该奖主要用于奖励从每年的KDD年会所录用的应用论文中挑选出来的、能较好体
现在数据挖掘应用中反映出挑战性的研究问题和经验教训的论文。  
5、 SIGKDD博士论文奖(SIGKDD Doctoral Dissertation Award) 
该奖项是从2008年开始设立,用于奖励在数据挖掘与知识发现领域作出出色研究工作的博士生。本科毕业于清华大学、来自美国UIUC的Xiaoxin Yin博士(导师为韩家炜教授)曾获得首届SIGKDD博士论文奖。 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值