数据挖掘的学习资源

数据挖掘(Data Mining)作为一个领域,比机器学习要大,偏应用。互联网公司也大量使用数据挖掘技术,作为即将毕业进入互联网公司从事机器学习算法开发的我,最近计划系统了解一下这方面的理论和技术。作为一个习惯,学习一个东西之前总要上网找找学习资源(网站,书籍,学术期刊会议),以保证学到的是最前沿最系统的知识,并以最高效率学习。

希望这些资源能够最终帮助自己了解这些酷炫的问题:搜索引擎是怎样工作的(为什么谷歌搜索的结果总是比百度好)?数据挖掘/机器学习在互联网公司的典型应用(例如社交网络上的大量信息腾讯和Facebook是怎么使用的以产生商业价值)?各种问答机器人的原理(如小度机器人/度秘,京东智能机器人)?

 

wikipedia.org,历史,领域概述,资源链接:

Data mining:介绍了数据挖掘的概念、过程、学术会议、软件等,右侧有细分条目;

Category:Data mining:更多和数据挖掘有关的条目;

DMOZ关于DM:资源链接;

谷歌上不了推荐镜像站,搜索和下载电子书籍推荐Library Genesis更多在线图书馆)。

 

大学课程、在线教程

Stanford课程:CS246 Mining Massive Data SetsCS246H Mining Massive Data Sets: Hadoop LabsCS341 Project in Mining Massive Data Sets,配套书籍 Mining of Massive DatasetsDataMiningTalk

CMU课程:Data Mining: Spring 2013Statistics 36-350: Data Mining (fall 2009)

南京大学课程:Introduction to Data Mining

Coursera:Data Mining Specialization

 

专著、书籍

Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeff Ullman, 2015; PPT;中文译本:大数据-互联网大规模数据挖掘与分布式处理;

Data Mining: The Textbook, Charu C. Aggarwal, 2015; 资源链接;

Data Mining: Concepts and Techniques (3rd ed.), Jiawei Han, Micheline Kamber, Jian Pei, 2011; PPT;中文译本:数据挖掘:概念与技术;

Data Mining and Analysis: Fundamental Concepts and Algorithms, Mohammed J. Zaki, Wagner Meira Jr, 2014; 作者网站;

Introduction to Data Mining, Pang-Ning Tan, Michael Steinbach, Vipin Kumar, 2006; PPT;中文译本:数据挖掘导论;

A Practical Guide to Data Mining for Business and Industry, Andrea Ahlemeyer-Stubbe, Shirley Coleman, 2014; PPT;

Data Mining: Practical Machine Learning Tools and Techniques (3rd ed.), Ian H. Witten, Eibe Frank, Mark A. Hall, 2011; PPT;中文译本:数据挖掘:实用机器学习工具与技术;

Programming Collective Intelligence: Building Smart Web 2.0 Applications, Toby Segaran, 2007; 中文译本:集体智慧编程。

 

学术论文

顶级会议:KDDICDE

更多会议期刊见:Google Scholar DMMicrosoft academic DMKDnuggets DM Conferences

 

学习网站

KDnuggets:各种资源,博文,课程、软件、Datasets等链接;

国内的两个网站:我爱机器学习机器学习日报

Data Sets:UCI Machine Learning RepositoryPublic datasets for machine learning

Competitions:KaggleDMCKnowledge PitTunedITDrivenData

这里也整理了一些资源,这里整理了数据挖掘博客。

 

程序、库

R语言RDataMininginside-R

HadoopTutorialHadoop at Yahoo

转载于:https://my.oschina.net/u/2365905/blog/865047

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值