Spark和Scala的网络资源汇集

Spark和Scala的网络资源汇集作者:chszs,未经博主允许不得转载。经许可的转载需注明作者和博客主页:http://blog.csdn.net/chszs本文的目的是为Spark和Scala初学者提供一些学习资源。1、Github上的Scala Workshophttps://github.com/airisdata/scalaworkshop2、Setup资源 下载Scala 2.11.8...
阅读(3258) 评论(2)

用Grafana为Elasticsearch做日志分析

用Grafana为Elasticsearch做日志分析.Grafana是一个开源的、功能强大的指标仪表板和图形编辑器工具,它面向Graphite、Elasticsearch、OpenTSDB、Prometheus和InfluxDB等数据源。目前Grafana的最新版本为2.6版。...
阅读(14485) 评论(4)

在Ubuntu环境部署Apache Spark集群

在Ubuntu环境部署Apache Spark集群作者:chszs,未经博主允许不得转载。经许可的转载需注明作者和博客主页:http://blog.csdn.net/chszs1、软件环境本文主要讲述怎样在Ubuntu系统上部署Apache Spark独立集群(Standalone Cluster)的过程。所需的软件如下: Ubuntu 15.10 x64 Apache Spark 1.5.1 2、...
阅读(2875) 评论(1)

Hadoop五分钟入门指南

《Hadoop五分钟入门指南》原文见:http://blog.josedacruz.com/2013/12/09/hadoop-in-5-minutes-for-beginners/#.Uqhs3_Q6Cjt如果你有大量的数据(TB级),而且这些数据到处分散,且有些数据是结构化的,有些数据不是。你想查询这些数据,你或许在想,“我需要力量来组织和查询这些数据”。是的,你需要Hadoop。一、什么是H...
阅读(2798) 评论(3)

如何让NoSQL内存数据库适合企业级应用

如何让内存NoSQL数据库适合企业级应用作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs英文原文:How to Make Your In-memory NoSQL Datastores Enterprise-Ready对于每一个关注用户体验的Web应用或移动应用而言,基于内存的NoSQL数据存储系统(例如开源的 Redis和Memcached)正逐步成为...
阅读(4818) 评论(1)

应该在什么时候使用Hadoop

应该在什么时候使用Hadoop作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs有人问我,“你在大数据和Hadoop方面有多少经验?”我告诉他们,我一直在使用Hadoop,但是我处理的数据集很少有大于几个TB的。他们又问我,“你能使用Hadoop做简单的分组和统计吗?”我说当然可以,我只是告诉他们我需要看一些文件格式的例子。他们递给我一个包含600MB数据...
阅读(8291) 评论(6)

大数据团队必须设置的五种职位

大数据团队必须设置的五种职位作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs麦肯锡认为,大数据团队必须有五种职位:1)数据卫生员(Data Hygienists) - 这些人,确保数据总是干净的、准确的。2)数据探索者(Data Explorers) - 这些人在大数据项目找到你真正需要的数据。3)企业解决方案架构师(Business Solution ...
阅读(13556) 评论(2)

大数据的实时处理STORM简介

《大数据的实时处理STORM简介》作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs新技术如社交媒体、电邮、博客、地理信息系统GIS、无线射频识别RFID和智能手机等为基于服务信息构建提供了新的机会。处理大数据常见的方法和框架是Apache Hadoop,它以批处理的方式运行数据处理任务。现在,如果需要实时处理数据和实时显示数据,那这种基于批处理的方式并不...
阅读(14932) 评论(0)

企业如何选择Hadoop

企业如何选择Hadoop作者:chszs,转载需注明。作者博客主页:http://blog.csdn.net/chszs本文讨论Apache Hadoop大数据工具及技术,帮助有效管理实时的大数据,并讨论Apache Hadoop大数据分析的优缺点。帮助企业认识Hadoop,在选择Hadoop技术方案上做出抉择。一、什么是大数据分析工具及技术Hadoop是目前的处理和存储海量数据的最佳工具。Had...
阅读(4512) 评论(2)

认识的误区:Hadoop=云计算

认识的误区:Hadoop=云计算作者:chszs,转载需注明。作者博客主页:http://blog.csdn.net/chszs时间:2012-12-9最近看到清华大学出版社发行的一本新书,《深入浅出云计算》出版时间是2012-10-01日,如图1所示。我以为这是一本科普型读物,是加深读者对云计算的认识的书籍,毕竟云计算覆盖的领域太广了。泛读后发现完全不是这么回事。全书基本上都是在讲Hadoop以...
阅读(14922) 评论(16)
    个人资料
    • 访问:5572568次
    • 积分:50504
    • 等级:
    • 排名:第66名
    • 原创:783篇
    • 转载:23篇
    • 译文:24篇
    • 评论:1159条
    一名路过的黑客

    大家好,我是黑客,专门盗账号的。现在这个人的帐号被我盗了,但看这个人平时的博客空间,一直过着艰苦努力、持之以恒的技术研究生活,勤奋刻苦,积极分享,无私奉献,我被深深的感动了,这是一个纯粹的人,人品这样的高尚,希望大家看到我这条消息后,可以私聊他,多鼓励他,不缺钱的就多给他一些经济上的资助,让他再接再厉!就这样吧,我下线了,眼框湿湿的难受。

    文章存档