大数据
文章平均质量分 73
RoQuant
一个量化投资爱好者
展开
-
大数据的前世今生-大数据特征与发展历程
大数据的定义与特征 大数据(big data)是这样的数据集合:数据量增长速度极快,用常规的数据工具无法在一定的时间内进行采集、处理、存储和计算的数据集合。 作者认为具有以下五大特征(4V+1O)的数据才称之为大数据,即: 数据量大(Volume)。第一转载 2014-11-24 10:37:11 · 3693 阅读 · 0 评论 -
Analyzing 1.1 Billion NYC Taxi and Uber Trips, with a Vengeance
Analyzing 1.1 Billion NYC Taxi and Uber Trips, with a VengeanceAn open-source exploration of the city's neighborhoods, nightlife, airport traffic, and more, through the lens of publicly available转载 2015-11-18 10:07:05 · 3668 阅读 · 0 评论 -
MongoDB + Spark: 完整的大数据解决方案
MongoDB上海的活动已经结束快1个月了,我们再来回顾一下TJ在大会上进行的精彩分享吧~ MongoDB + Spark: 完整的大数据计算解决方案。Spark介绍按照官方的定义,Spark 是一个通用,快速,适用于大规模数据的处理引擎。通用性:我们可以使用Spark SQL来执行常规分析, Spark Streaming 来流数据处理, 以及用Mlib来执行机器学习转载 2016-12-23 15:01:53 · 608 阅读 · 0 评论 -
最神秘的大数据公司Palantir
最神秘的大数据公司Palantir(一)http://www.infoq.com/cn/articles/the-most-mysterious-big-data-company-palantir-part01最神秘的大数据公司Palantir(二)http://www.infoq.com/cn/articles/the-most-mysterious-bi转载 2017-01-08 15:11:31 · 853 阅读 · 0 评论 -
Spark VS Hadoop:两大大数据分析系统深度解读
大数据,无论是从产业上,还是从技术上来看,都是目前的发展热点。在中国,政府控制着80%的数据,剩下的多由“BAT”这样的大公司拥有,中小企业如何构建自己的大数据系统?其他企业如何建设自己的大数据系统?推荐两大应用最广泛、国人认知最多的Apache开源大数据框架系统:spark HadoopSpark:速度快、易于使用Spark以性能见长,但是它也因易用性而小有名气,原因是它转载 2016-12-20 22:33:55 · 648 阅读 · 0 评论 -
人工智能在深度学习领域的前世今生
http://www.leiphone.com/news/201608/Rlq2Vq5v8peap07S.html这两年人工智能热闹非凡,不仅科技巨头发力AI取得技术与产品的突破,还有众多初创企业获得风险资本的青睐,几乎每周都可以看到相关领域初创公司获得投资的报道,而最近的一次春雷毫无疑问是Google旗下Deepmind开发的人工智能AlphaGo与南韩李世石的围棋之战,Ai转载 2017-01-09 10:50:31 · 1208 阅读 · 0 评论 -
SparkR Notebooks
https://github.com/jadianes/spark-r-notebooksSparkR NotebooksThis is a collection of Jupyter notebooks intended to train the reader on different Apache Spark concepts, from basic to转载 2017-01-10 17:27:42 · 483 阅读 · 0 评论 -
上海拟三年培养和引进近千名高端大数据人才
根据《上海推进大数据研究与发展三年行动计划》,上海3年内拟培养和引进千名高端数据人才,日前正式启动“数据科学和大数据人才培养计划”。 据悉,作为“三年行动计划”的技术支撑基地,上海市数据科学重点实验室(复旦大学)先期开展“大数据工程硕士项目”,首批招收100至200人,采取两年半学制,授予工程硕士学位。同时,还面向在校大学生,由复旦大学研究生院建设一批研究生开放课程,2014年度有转载 2014-10-11 16:55:11 · 671 阅读 · 0 评论 -
大数据告诉你梅西完美得不可思议
http://www.ctocio.com/ccnews/16022.html转载 2014-07-16 16:51:59 · 843 阅读 · 0 评论 -
北大教授王汉生:大数据被神化
对话动机近来,大数据不断被提及,成为了一个热门概念。企业纷纷宣称自己的大数据能力很强,但网民被推送的“精准广告”常常是没用的垃圾信息处理。中国企业的大数据能力究竟如何?大数据方便了生活,也带来了隐私和安全风险,其边界在哪里?6月12日,就大数据的热点问题,新京报记者和北京大学光华管理学院商务统计与经济计量系教授王汉生展开对话。人物简介王汉生北京大学光华管理学院商务统计与经济转载 2014-07-16 17:45:44 · 1383 阅读 · 0 评论 -
《魔兽世界》衰败之因:掉进“大数据陷阱”
玩《魔兽世界》的人越来越少了。这并非笔者的主观臆断。其2013年第一季度的财报显示,虽仍保有830万付费玩家,全球最多,但与上季相比,却一下子锐减了130万。 《魔兽世界》有着辉煌的历史,而且并不遥远。这款诞生于2004年的超级网游,曾于2010年10月创下了付费玩家1300万的惊人纪录。不仅如此,亚洲玩家和欧美玩家几乎各占一半。作为一款文化产品,“魔兽”成功地跨越了东西文明间的高墙,创造了转载 2014-07-25 09:54:28 · 819 阅读 · 0 评论 -
摆脱“战略早搏” 切勿掉进大数据陷阱
当前,业界对于大数据商业模式的追捧似乎已形成一股铺天盖地的热潮。我们不妨来看一个个在不断的传播中已经演绎成为商业神话的故事。塔吉特神话与京东“神预测”2012年,美国一名男子因为附近的连锁超市塔吉特(Target)莫名其妙地向他正在上高中的17岁女儿邮递婴儿尿片和童车优惠券而大发雷霆,向塔吉特提出强烈抗议。但是,一个月后,这位父亲又来到塔吉特表示歉意。原来,他的女儿真的怀孕了,而塔吉特比这转载 2014-07-25 09:56:16 · 745 阅读 · 0 评论 -
Netflix是怎么火起来的
《纸牌屋》的一炮走红,使网飞(Netflix)炙手可热,但令人难以想象的是,直到成功前的最后一分钟,网飞的共同创始人还认为,他们百般折腾的这个公司就是“一坨狗屎”。1999年底,市场迎来了DVD的繁荣时代,网飞月收入达到10万美元,成为一家理论上的百万资产公司。正是事业风生水起的时候,马克却要求管理团队退出DVD销售,聚焦租赁渠道业务,不然公司将一蹶不振。在推广网飞DVD网上订阅的过程中,转载 2014-07-25 14:36:41 · 1359 阅读 · 0 评论 -
Google和facebook如何应用R进行数据挖掘
在R用户组织的主题为“R与预测分析科学”的panel会议上,有来自工业界的四位代表发表了讲话,介绍各自在工业界是如何应用R进行数据挖掘。他们分别是:Bo Cowgill, GoogleItamar Rosenn, FacebookDavid Smith, Revolution ComputingJim Porzak, The Generations Network 他们转载 2014-08-21 09:32:35 · 1022 阅读 · 0 评论 -
Netflix逆袭:从失足青年到硅谷精英
[导读]Netflix可以利用数据帮助挑选未来剧集的演员和导演,实现艺术和科学的混合。Netflix首席执行官里德·哈斯廷斯北京时间5月16日消息,国外媒体近日刊载文章,讲述了流媒体视频服务提供商Netflix及其首席执行官里德·哈斯廷斯如何经历并熬过了一次次的失误,最终加入硅谷“精英社团”的故事。以下是这篇文章的全文:在正常情况下,周末晚上Netflix在美国家庭互联网流量中转载 2014-08-11 15:00:18 · 1054 阅读 · 0 评论 -
SparkR (R on Spark)
http://spark.apache.org/docs/latest/sparkr.htmlSparkR (R on Spark)OverviewSparkDataFrameStarting Up: SparkSessionStarting Up from RStudioCreating SparkDataFramesFrom local data f转载 2017-01-10 17:31:11 · 1699 阅读 · 0 评论