- 博客(15)
- 资源 (10)
- 收藏
- 关注
转载 看完你就牛了!2014年大数据行业深度梳理总结
大数据时代不是突然出现的,实际上过去的几十年间,数学分析就已经涉猎金融行业了,诺贝尔经济学奖获得者哈里.马克维茨、威廉.夏普、罗伯特.恩格尔就是利用计量经济学知识和金融市场数据来建立数学模型,预测金融市场产品收益同风险波动的关系。大数据时代的出现简单的讲是海量数据同完美计算能力结合的结果。确切的说是移动互联网、物联网产生了海量的数据,大数据计算技术完美地解决了海量数据的收集、存储、计算、分析的问题
2014-12-27 17:32:04 1855
转载 Ansible vs Chef
Postedby ScriptRock Jul 17, 2014 8:00:00 AMThis is a tale of a newcomer vsa relative oldie in the Configuration Management (CM) arena. Both are tools tohelp the sysadmin or devops professional to b
2014-12-19 10:32:22 1231
转载 在云上搭建大规模实时数据流处理系统
如今数据规模变得越来越大,传统的软硬件工具已很难满足数据处理的需求。本文将结合汽车状态实时监控系统,讲述如何在阿里云上使用Kafka和Storm搭建大规模消息分发和实时数据流处理系统,及其中遇到的挑战。在大数据时代,数据规模变得越来越大。由于数据的增长速度和非结构化的特性,常用的软硬件工具已无法在用户可容忍的时间内对数据进行采集、管理和处理。本文主要介绍如何在阿里云上使用Kafka和Sto
2014-12-17 08:52:35 1123
转载 卡耐基梅隆大学教授邢波:Petuum,大数据分布式机器学习平台
要:BDTC 2014中国大数据技术大会首日全体大会上,卡耐基梅隆大学教授、ICML 2014程序主席邢波带来了名为“A New Platform for Cloud-based Distributed Machine Learning on Big Data”的主题演讲。【CSDN现场报道】2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科
2014-12-16 10:31:50 947
转载 程学旗发布大数据白皮书与发展趋势报告
程学旗摘要:中科院计算所研究员,CCF大数据专家委员会秘书长程学旗发布大数据白皮书与发展趋势报告。介绍了大数据的背景与动态、典型应用、技术进展等内容。程学旗对2015年大数据发展预测用了8个字:融合、跨界、基础、突破。【CSDN现场报道】2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研、应用与产业
2014-12-16 10:00:42 1206
转载 Facebook数据仓库揭秘:RCFile高效存储结构
摘要:本文介绍了Facebook公司数据分析系统中的RCFile存储结构,该结构集行存储和列存储的优点于一身,在MapReduce环境下的大规模数据分析中扮演重要角色。 Facebook曾在2010 ICDE(IEEE International Confere本文介绍了Facebook公司数据分析系统中的RCFile存储结构,该结构集行存储和列存储的优点于一身,在MapReduce环
2014-12-11 09:04:10 619
转载 Facebook的数据仓库是如何扩展到300PB的
摘要:Facebook在数据仓库上遇到的存储可扩展性的挑战是独一无二的。我们基于Hive的数据仓库中存储了超过300PB的数据,并且以每日新增600TB的速度增长。去年这个数据仓库所存储的数据量增长了3倍。Facebook在数据仓库上遇到的存储可扩展性的挑战是独一无二的。我们基于Hive的数据仓库中存储了超过300PB的数据,并且以每日新增600TB的速度增长。去年这个数据仓库所存储的
2014-12-11 09:02:43 905
转载 人工智能和机器学习领域有哪些有趣的开源项目?
本文简要介绍了10款 Quora上网友推荐的 人工智能和机器学习领域方面的开源项目。本文简要介绍了10款 Quora上网友推荐的 人工智能和机器学习领域方面的开源项目。 GraphLabGraphLab是一种新的面向机器学习的并行框架。GraphLab提供了一个完整的平台,让机构可以使用可扩展的机器学习系统建立大数据以分析产品,该公司客户包括Zillow、A
2014-12-10 10:37:14 809
转载 数据中心operating system正当其时
摘要:目前分布式应用越来越普遍,而这股热潮似乎已涌入到数据中心管理领域。近日Apache Mesos联合创始人Benjamin Hindman撰文分析当前分布式应用的现状、开发者/运营者面临的困境及解决之道!【编者按】 目前分布式应用越来越普遍,而这股热潮似乎也正在涌入到传统的数据中心管理领域。然而却不利于开发者/运营者,这是因为这些应用不再仅限于在一台服务器上工作,更多地会是在数据中
2014-12-09 09:41:48 704
转载 【重磅】凯文.凯利8个小时演讲实录
点击标题下「大数据文摘」可快捷关注超级重磅,值得收藏!笔记:顾晓明/研习社华东四群/i8小时地点:上海星河湾大酒店出品:颠覆式创新研习社《失控》作者,美国《连线》(Wired)杂志的创始人,被马化腾和众多中国互联网精英推崇的“硅谷精神教父”、“技术先知”的凯文·凯利。他最令人钦佩的成就,是准确预言了“互联网未来
2014-12-09 09:36:16 1810
转载 大数据时代,我们需要有超越 Hadoop和MapReduce的杀手级技术
过去 25 年来,位居主流地位的关联式资料库(Relational Databases),在云端计算与 大数据的发展中突显了其不足之处,所以在最近几年受到了「NoSQL」发展的挑衅与威胁。 像 Facebook、Google、Twitter 等大型网络企业,为了解决大量的资料存取问题,纷纷舍弃了关联式资料库技术,改以其它的相关技术,如「NoSQL」或是「Not Only SQL」等技
2014-12-04 11:32:18 724
转载 Aeron: Do We Really Need Another Messaging System?
Do we really need another messaging system? We might if it promises to move millions of messages a second, at small microsecond latencies between machines, with consistent response times, to large n
2014-12-03 10:44:42 1173
转载 周鸿祎:以大数据技术对抗大数据平台安全威胁
统问题之外,网络攻击手段更加丰富。其中,终端恶意软件、恶意代码是黑客或敌对势力攻击大数据平台、窃取数据的主要手段之一。目前网络攻击越来越多地是从终端发起的。终端渗透攻击也已成为国家间网络战的主要方式。例如著名的攻击伊朗核设施的“震网病毒”,就是利用了 Windows 操作系统的漏洞入侵了特定终端,渗透到伊朗核电站内部局域网对伊朗核设施进行破坏。另外,针对大数据平台的高级持续性威胁(Advanced
2014-12-03 10:12:52 1042
转载 核桃运算创办人薛文蔚推出即时资料分析引擎
颠覆资料运算模式 「我们现在还在用1945年所设计出的电脑运算模式!」(也就是范纽曼架构)薛文蔚解释,以前记忆体很小,把资料当成外来物,程式和塬始码是一等居民,支配资料。每次要运算时,都要把资料从硬碟内搬移至记忆体运算,再搬回硬碟,花费很多时间在「搬移」。 目前大多数使用者端的资料库和程式都以这种逻辑设计出来,薛文蔚说,这样的工作台模式适合资料运算吗? 所以,核桃运算
2014-12-03 10:02:17 804
转载 How to Get Started in Data Science
A lot of people ask me: how do I become a data scientist? I think the short answer is: as with any technical role, it isn’t necessarily easy or quick, but if you’re smart, committed and willing to inv
2014-12-02 00:44:15 1070
OpenStack2014UserSurveyFromOpenStackCN.pdf
2014-11-08
f4: Facebook’s Warm BLOB Storage System
2014-10-29
美国大数据工程师面试宝典.pdf
2014-10-17
Big Data For Dummies.pdf
2014-10-07
Cloud Computing Bible
2014-10-05
Big data for dummies
2014-10-05
The Linux Knowledge Base and Tutorial
2014-10-05
The Linux Command Line
2014-10-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人