大数据
文章平均质量分 72
Er8cJiang
这个作者很懒,什么都没留下…
展开
-
Uber无模式数据存储
Uber无模式数据存储设计无模式。Uber工程师使用MySQL定制数据库,允许我们从2014向后扩展。这是无模式三部分系列的第一部分。 在项目Mezzanine中,我们描述了如和从单一Postgres实例迁移Uber核心到无模式、容错以及高可用的数据库。这篇文章进一步描述其结构以及扩展已经存在Uber基础设施的无模式的作用,以及怎么走过来的。 新数据库竞赛早在2014年,由于蓬勃发展的行程增长,翻译 2016-03-17 16:16:11 · 1426 阅读 · 0 评论 -
分析,大数据,数据挖掘,数据科学,机器学习100个活跃的博客
分析,大数据,数据挖掘,数据科学,机器学习100个活跃的博客留在数据科学技能的巅峰!下面是对大数据,数据科学,数据挖掘,机器学习和人工智能约100最活跃,最有趣的博客的列表。Devendra Desale发表于KDnuggets.以下是有关100个活跃并定期更新博客,按英文字母顺序排列如下。 3Blades 云数据分析。http://www.3blades.io/blog/雅培分析(院长雅培和威翻译 2016-04-05 18:01:53 · 3306 阅读 · 0 评论 -
数据科学中R VS Python:获胜者是...
数据科学中R VS Python:获胜者是…在”最佳”数据科学工具的比赛中,R和Python都有自己的优缺点.对二者的选择取决于使用背景,学习花费和其他常用工具的需要 Martijn Theuwissen发表于DataCamp.在DataCamp,学生经常问我们他们日常数据分析任务使用R或Python。虽然我们主要是提供交互式R教程,我们总是回答这个问题取决于他们所面对的数据分析挑战的类型。 R和翻译 2016-04-05 16:41:48 · 3855 阅读 · 0 评论 -
数据科学的战争:R vs Python
转载请注明.转载 2016-04-05 15:18:56 · 1091 阅读 · 0 评论 -
AlphaGo 真的如此重要么?
AlphaGo 真的如此重要么?转载请注明! 围棋对弈程序捕捉人的直觉元素,指望产生深远结果的预知。 1997年,IBM的Deep Blue系统击败了国际象棋世界冠军Garry Kasparov。当时,胜利被广泛描述为人工智能的里程碑。但Deep Blue的技术被证明是只对国际象棋有用的,仅此而已。计算机科学没有经受革命。最近击败历史上最强的棋手的AlphaGo Go-playing系统有翻译 2016-04-03 19:37:39 · 936 阅读 · 0 评论 -
2016 Y Combinator Winter 13家机器学习&数据分析初创公司
Y Combinator Winter 2016 13家机器学习&数据分析初创公司Introduction转载请注明! 企业家的灵感来源于商业构想如果你打算开发一个产品,我建议先查看这些初创公司。你可能对你的产品发现新的角度,并使用机器学习&预测分析让你的产品更强大。 这些初创公司得到了Y Combinator每年2次$120k的投资。诸如Reddit, Quora, Airbnb, Dro翻译 2016-04-02 21:08:32 · 1375 阅读 · 0 评论 -
Spark 深度学习的悖论实效
Spark 深度学习的悖论实效转载请注明!在过去三年,Databricks 最聪明的工程师研究一个秘密的项目。今天,我们揭秘DeepSpark,这是Apache Spark一个虫咬的里程碑。DeepSpark使用前沿神经网络自动化许多手工过程,包括软件开发,修复bug,按照规范实现特征,并通过pull request(PRs)审查正确性。 扩展Spark的开发一直是我们首要的任务。每年,Spa翻译 2016-04-02 23:31:08 · 835 阅读 · 0 评论 -
谷歌DeepMind现在可以分析万智牌和炉石卡
谷歌DeepMind现在可以分析万智牌和炉石卡随着复古游戏和围棋被征服,像Google DeepMind这样的人工智能转向何方?很明显,万智牌和炉石传说(:( 我对这个很伤心). 在你太激动之前,没有计划设定AI自由游戏.至少现在没有. 就目前而言,牛津大学的父老乡亲对DeepMind分析卡牌数据并将其转换为代码非常高兴.本质上,设定的任务是一个翻译人的数据为机器语言,同时卡牌有自己的游戏语言和翻译 2016-04-01 18:34:18 · 1383 阅读 · 0 评论 -
Alphabet 和 Facebook的Stratospheric Internet纠结于繁文缛节
Alphabet and Facebook的Stratospheric Internet纠结于繁文缛节转载请注明! 计划使用无人机和气球提供无线上网,需要监管机构相当大的帮助,比如监测领空和通讯卫星。 对于气候和商用航空交通的问题,平流层可能是想差基础设施地区放射网路连接信号最好的地方。Alphabet and Facebook 都致力于开发无人机,在18千米以上的高空作业,今年Alphabet翻译 2016-04-04 22:43:49 · 869 阅读 · 0 评论 -
Pinterest主页的机器学习
Pinterest拥有超过300亿(正在增长)附有背景和视觉信息的“pin”。1000W用户每天通过浏览器、搜索、pin以及通过点击外部网站访问交互。主页收集用户发布的pins,公布到boards并按兴趣划分,同时为用户挑选推荐,因此主页成为最重要的用户参与服务,并贡献相当大比例的repins。越来越多的用户pin,人们可以获取更好的Pinterest,我们处于一个独特的位置为探索持续不断的提供灵感翻译 2016-03-16 17:52:43 · 982 阅读 · 0 评论 -
Kafka数据流:让流处理更轻松
很高兴宣布,Apache Kafka的一项新功能预览叫Kafka Streams。Kafka Streams是一个使用Apache Kafka用于构建分布流处理应用的Java库。这将是即将更新Kafka-0.10版本的一部分,并且已经提供可以很容易试用的预览版。 使用Kafka Stream构建一个流处理应用如下所示: 尽管还是一个很简陋的库,但是Kafka Stream解决了许多流翻译 2016-03-16 17:53:58 · 8385 阅读 · 1 评论 -
Kafka在大数据生态系统中的价值
在最近几年,Apache Kafka的使用量急剧增长。目前Kafka的用户包括Uber,Twitter,Netflix,LinkedIn,Yahoo,Cisco,Goldman Sachs等等。Kafka是一个可扩展的发布/订阅系统。用户可以发布大量信息到系统,同样可以通过订阅消费这些数据。本博客解释了为什么Kafka越来越受欢迎,以及它在大数据生态系统的作用。one-size-fits-all模型翻译 2016-03-17 16:15:25 · 2049 阅读 · 0 评论 -
P值已经被废,学的东西有多少是真的?
美国统计协会发布有关统计学意义和P值的声明–提供提高定量科学的行为和解释的准则美国统计协会(ASA)发布了”统计意义和P值的声明”,其中包含正确使用,解释p值的6个原则.ASA发布这个P值的指南,以提高定量科学的行为和解释,并告知越来越重视科学重复性的研究.声明中同时指出,科学研究和大型复杂数据集的扩散的量化扩大了统计范围和选择适当技术的重要性,进行得当分析以及正确的解释. 良好的统计实践是科学实原创 2016-04-05 20:52:04 · 2854 阅读 · 0 评论