7 Important Data Science Papers

转载 2013年12月06日 11:21:13

转自:http://datascience101.wordpress.com/2013/08/26/7-important-data-science-papers/

It is back-to-school time, and here are some papers to keep you busy this school year. All the papers are free. This list is far from exhaustive, but these are some important papers in data science and big data.

Google Search

  • PageRank – This is the paper that explains the algorithm behind Google search.

Hadoop

  • MapReduce – This paper explains a programming model for processing large datasets. In particular, it is the programming model used in hadoop.
  • Google File System – Part of hadoop is HDFS. HDFS is an open-source version of the distributed file system explained in this paper.

NoSQL

These are 2 of the papers that drove/started the NoSQL debate. Each paper describes a different type of storage system intended to be massively scabable.

Machine Learning

Bonus Paper

  • Random Forests – One of the most popular machine learning techniques. It is heavily used in Kaggle competitions, even by the winners.

Are there any other papers you feel should be on the list?


Sicily---1034. Forest

思路:由于题目要求合法的图应该 ①没有环 ②没有入度大于1的顶点,符合树的特点,因此,其实合法的输入其实是一堆树的集合,即为森林(o(╯□╰)o好吧,这点从题目就能看得出来)解决方法:判断是否会生成环...
  • qq_30172585
  • qq_30172585
  • 2016年11月29日 14:52
  • 653

Carmichael Numbers - UVa 10006 素数判断

Carmichael Numbers An important topic nowadays in computer science is cryptography. Some people e...
  • u014733623
  • u014733623
  • 2014年12月16日 17:57
  • 365

UVA 10006

UVA 10006 An importanttopic nowadays in computer science is cryptography. Some people even think tha...
  • SnowdenJobs
  • SnowdenJobs
  • 2016年08月28日 10:41
  • 206

Python for data science

想最近巩固一下Python,在看kaggle教程的时候发现了一个学习网站,感觉很靠谱。 里面还有很多R语言和数据可视化的课程,准备如果需要的话慢慢看! 网站链接如下: https://www.d...
  • qinzhushusheng
  • qinzhushusheng
  • 2016年09月07日 20:51
  • 280

Data Science Bowl 2017数据预处理

1、读取数据 import pandas as pd labels_df = pd.read_csv('/home/zengxl/datasets/stage1_') ERROR...
  • zxllll8898
  • zxllll8898
  • 2017年07月25日 15:45
  • 366

UVA 10006 - Carmichael Numbers 数论(快速幂取模 + 筛法求素数)

Carmichael Numbers  An important topic nowadays in computer science is cryptography. Some peopl...
  • LYHVOYAGE
  • LYHVOYAGE
  • 2013年08月03日 15:13
  • 2629

<OJ_Sicily>Forest

使用深度搜索求解森林的深度和宽度
  • Vipin_Pei
  • Vipin_Pei
  • 2016年05月26日 11:16
  • 281

UVA 10006 - Carmichael Numbers 数论(快速幂取模 + 筛法求素数)

Carmichael Numbers  An important topic nowadays in computer science is cryptography. Some...
  • u013050857
  • u013050857
  • 2014年07月25日 10:09
  • 716

Data Science完整学习路径Python版

《Comprehensive learning path – Data Science in Python》,为Python新手提供一个全面的学习路径来进行数据分析。这条路径提供了一个全面的概述,您可...
  • LuyaoYing001
  • LuyaoYing001
  • 2017年10月10日 18:43
  • 313

我们分析了全美Top Business Analyst 和 Data Science专业,最后给你总结了这几点

身边很多朋友提过或者是想要走进大数据这个行业每个人的Background不一样,能力,擅长的领域都不一样小编有一句发自肺腑的话要说给大家听:不是热门的,薪水高的,所谓好找工作的专业就值得去学;真正值得...
  • zw0Pi8G5C1x
  • zw0Pi8G5C1x
  • 2018年01月06日 00:00
  • 2237
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:7 Important Data Science Papers
举报原因:
原因补充:

(最多只允许输入30个字)