博客专栏  >  互联网   >  大数据

大数据

大数据,将创造出更新更具竞争力的超级企业!

关注
12 已关注
31篇博文
  • Spark的Utils工具类

    Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。        Spark 是一种与 Hado...

    2018-03-18 21:34
    182
  • CentOS6.5_X64下安装配置MongoDB数据库

    环境准备: 硬件要求:50G硬盘 8G内存 4核CPU 软件要求:Linux操作系统:CentOS6.5_X64  mongodb-linux-x86_64-2.7.0.tgz  目的: 安...

    2016-06-04 09:55
    7780
  • MongoDB数据导出、导入及索引建立

    MongoDB数据导出、导入及索引建立 (1)    数据导出——每个表一个文件: # mongoexport --db project --collection 表名 --out 输出文件名,如: ...

    2016-06-04 09:54
    10794
  • 大数据最具潜力的12大应用领域

    1. 人工智能(Artificial intelligence)。看了人机围棋大战,是不是为人工智能的威力而感叹?方寸纹枰之间,谷歌智能系统阿尔法狗(AlphaGo)霸气侧漏,以4:1的绝对性优势战胜...

    2017-11-26 21:58
    707
  • 十种大数据技术方案

    http://zhuanlan.51cto.com/art/201608/516102.htm?edm 时至今日,大数据目前已经在企业中得到快速推广,也有大量开源及成熟技术方案可供客户选择。对于企...

    2017-01-25 09:27
    1174
  • 大数据核心技术

    Common:在2.2.0以前的大多数版本中,包含HDFS、MapReduce和其他项目公共内容,从2.2.0开始HDFS和MapReduce被分离为独立的子项目,其余内容为Hadoop Commo...

    2017-03-31 12:44
    703
  • 大数据时代-- 一个创造超级竞争力企业的时代

    这是一个快速发展的时代,随着互联网的普及,数据成指数倍增长,相同类型的企业也如雨后春笋般越来越多!那么如何在这个快速发展的时代,脱颖而出,把握时代的脉搏?提高企业的生存和竞争力,大数据无疑是一把利剑,...

    2016-06-19 22:57
    7511
  • Hadoop源码分析下载、最新最全资料分享

    apache_hadoop源码,下载: http://archive.apache.org/dist/ Hadoop 工具下载: http://hadoop.apache.org/ H...

    2016-05-05 14:12
    4884
  • 引爆Spark大数据引擎的七大工具

    原文名称:7 tools to fire up Spark's big data engine         Spark正在数据处理领域卷起一场风暴。让我们通过本篇文章,看看为Spark的大数据平...

    2016-04-05 14:05
    3676
  • Hadoop RPC远程过程调用源码解析及实例

    RPC简介: RPC(Remote Procedure Call)远程过程调用,它允许一台计算机程序远程调用另外一台计算机的子程序,而不用去关心底层的网络通信细节,对我们来说是透明的。经常用于分布式网...

    2016-03-24 10:31
    891
  • Hadoop Shell命令详解

    说明:调用文件系统(FS)Shell命令应使用bin/hadoop fs 的形式。所有的的FS shell命令使用URI路径作为参数。 1、cat 说明:将路径指定文件的内容输出到stdout...

    2016-03-21 14:36
    2176
  • 高效分布式计算系统:Spark

    一. 什么是Spark? Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,...

    2016-03-18 11:29
    3512
  • 浅谈Storm流式处理框架

    Hadoop的高吞吐,海量数据处理的能力使得人们可以方便地处理海量数据。但是,Hadoop的缺点也和它的优点同样鲜明——延迟大,响应缓慢,运维复杂。       有需求也就有创造,在Hadoop基本...

    2016-03-18 11:14
    27557
  • Hadoop MapReduce框架详解

    Mapreduce初析        Mapreduce是一个计算框架,既然是做计算的框架,那么表现形式就是有个输入(input),mapreduce操作这个输入(input),通过本身定义好的计算...

    2016-03-18 11:07
    1806
  • Hadoop在线分析处理(OLAP)

    数据处理与联机分析处理 ( OLAP )         联机分析处理是那些为了支持商业智能,报表和数据挖掘与探索等业务而开展的工作。这类工作的例子有零售商按地区和季度两个维度计算门店销售额,银行按...

    2016-03-18 10:37
    3422
  • Hadoop 系统的存储引擎和在线事务处理

    Hadoop 引擎上的 SQL 有许多广泛的应用领域: 数据处理与在线分析处理(OLAP)改进优化在线事务处理(OLTP) 存储引擎: 今天 Hadoop 主要有三个存储引擎:分别是...

    2016-03-18 10:32
    2404
  • 大数据递归思维

    在初学计算机编程时,我想大多数人的经历会和作者一样,学校为我们挑选一门语言,大多为 C 或 Java,先是基本的数据类型,然后是程序控制语句,条件判断,循环等,书上会教我们如何定义一个函数,会说程序就...

    2016-03-17 12:41
    1533
  • spark闭包

    定义 关于闭包有太多种解释,但基本上都很难用一两句解释清楚,下面这句简短的定义是我见过的最精炼且准确的解释了: A closure is a function that carries an imp...

    2016-03-17 12:29
    1864
  • Scala之主构造函数

    主构造函数        首先,我们必须要非常清晰明确的认识到:主构造函数不是你看到的class后面跟的参数列表,那怎么可能是主构造函数呢?那只是主构造函数的函数列表!那主构造函数的函数体在那里...

    2016-03-17 12:25
    923
  • JVM 并发性: Java 和 Scala 并发性基础

    Java 并发性支持 在 Java 平台诞生之初,并发性支持就是它的一个特性,线程和同步的实现为它提供了超越其他竞争语言的优势。Scala 基于 Java 并在 JVM 上运行,能够直接访问所有...

    2016-03-17 11:28
    3759

img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部