博客专栏  >  云计算/大数据   >  大数据实践

大数据实践

主要用于分享大数据、云计算方面的内容,包含但不限于分享hadoop,hive,hbase,zookeeper,spark,stom等内容!欢迎关注!

关注
12 已关注
16篇博文
  • Spring+SpringMVC+MongoDB案例

    MongoDB是一个NoSql数据库,MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。 MongoDB 是一个介于关系数...

    2017-03-22 21:35
    1466
  • 基于openstack构建私有云实践

    主要分享的是云计算、openstack的使用、私有云平台建设、云服务器云硬盘的构建和使用。从基本概念入手到私有云建设,信息量非常大。对于openstack的安装部署都是从官方文档中一步步的介绍,内容非...

    2017-02-02 13:35
    1508
  • KVM虚拟化技术实践

    今天分享的文章是关于云计算中的kvm(虚拟化技术),通过本文你可以知道的是kvm是干什么的,如何使用kvm,如何通过java操作xml从而生成生成虚拟机。KVM 全称是 基于内核的虚拟机(Kernel...

    2017-02-01 16:01
    1492
  • Elasticsearch+Hbase实现海量数据秒回查询

    首先祝大家2017新年快乐,我今天分享的是通过ElasticSearch与hbase进行整合的一个搜索案例,这个案例涉及的技术面比较广,首先你得有JAVAEE的基础,要会SSM,而且还要会大数据中的h...

    2017-01-01 16:38
    5910
  • MongoDB实用教程

    MongoDB 是一个基于分布式文件存储的数据库。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。本文主要内容包括nosql的简介、mongodb的简介、mongodb的体系结构、mongod...

    2016-06-27 16:27
    8656
  • 海量数据挖掘之中移动流量运营系统

    通过本文的学习主要是进一步了解海量数据挖掘的框架流程,对数据采集流程、内容识别、知识库的建立以及行为轨迹增强有初步的了解,学会简单的url清洗以及能够开发出简单的分类MapReducer程序。对于运营...

    2016-06-16 17:30
    9663
  • HBase的环境配置及其应用

    hbase是bigtable的开源山寨版本。是建立的hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。 它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的...

    2016-06-16 10:47
    8996
  • HA机制下的Hadoop配置

    hdfs的HA机制 NameNode服务器一台是ACTIVE和一台是STANDBY。通过Qjournal(日志管理系统) 使用zkfc(基于zookeeper失败切换控制)如何防止脑裂现象: 当...

    2016-06-15 12:24
    7340
  • Zookeeper的安装配置及基本开发

    一、简介              Zookeeper 是分布式服务框架,主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等等。...

    2016-05-27 16:50
    7717
  • Hive基本原理及环境搭建

    今天我主要是在折腾这个Hive,早上看了一下书,最开始有点凌乱,后面慢慢地发现,hive其实挺简单的,以我的理解就是和数据库有关的东西,那这样的话对我来说就容易多啦,因为我对sql语法应该是比较熟悉了...

    2016-05-27 10:39
    7963
  • Hadoop开发环境搭建

    之前稍微了解了一下大数据方面的知识,在搭建环境的时候我很惆怅的,因为那时候没有弄好,刚好这几天有时间,于是把以前没有弄好的又来配置了一下,没想到居然成功了,这个过程走了很多的弯路,查阅了网上大量资料,...

    2016-05-25 16:27
    15015
  • HDFS基本原理及数据存取实战

    本文主要介绍了hdfs的基本原理、hdfs基本操作、hdfs的读取数据流程、namenode工作机制,rpc编程以及常见的两种必会的面试题等,旨在于全面深入的理解HDFS的基本工作流程并可以开发出简易...

    2016-06-10 11:58
    7417
  • 大数据实战:用户流量分析系统

    本文是结合hadoop中的mapreduce来对用户数据进行分析,统计用户的手机号码、上行流量、下行流量、总流量的信息,同时可以按照总流量大小对用户进行分组排序等。是一个非常简洁易用的hadoop项目...

    2016-06-11 13:14
    5835
  • 数据分析之共同好友统计

    今天主要分享一个统计共同好友的案例,非常简单也非常实用的一个小案例,对于数据分析初级开发人员是很好的入门资料。 上面这段数据的意思是:A的好友有B,C,D,F,E,O,B的好友有A、C、E、K,其他的...

    2016-06-12 16:46
    5904
  • Hive的HQL语句及数据倾斜解决方案

    Hive环境的搭建在这里也不重复说了,安装配置可以查看我的这篇文章:http://blog.csdn.net/sdksdk0/article/details/51512031。在这里主要是分享一下HQ...

    2016-06-14 23:05
    10906
  • Zookeeper动态更新服务器列表

    zookeeper内部就是一个集群,主节点是选举出来的,外部看起来就像只有一台一样,保存的是一份状态数据。 做分布式应用协调的时候,可以降低开发难度。 具有高可用性,松耦合交互方式。主要应用1、集群管...

    2016-06-15 07:49
    7276

img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部