博客专栏  >  云计算/大数据   >  大数据生态系统技术

大数据生态系统技术

大数据时代。Hadoop是实现大数据的一种技术

关注
56 已关注
60篇博文
  • 数据挖掘算法之贝叶斯网络

    贝叶斯网络 序: 上上周末写完上篇朴素贝叶斯分类后,连着上了七天班,而且有四天都是晚上九点下班,一直没有多少时间学习贝叶斯网络,所以更新慢了点,利用清明节两天假期,花了大概七八个小时,写了这篇博客,...

    2017-04-04 19:06
    1399
  • 数据挖掘算法之深入朴素贝叶斯分类

    写在前面的话:   我现在大四,毕业设计是做一个基于大数据的用户画像研究分析。所以开始学习数据挖掘的相关技术。这是我学习的一个新技术领域,学习难度比我以往学过的所有技术都难。虽然现在在一家公司实习,但...

    2017-03-26 22:04
    3832
  • Storm UI详解

    Storm ui 展示字段说明 Storm ui 首页主要分为4块: Cluster Summary,Topology summary,Supervisor summary,Nimbus Con...

    2016-12-02 09:34
    3289
  • 搭建storm集群

    搭建storm集群 系统centos7 1、安装Java jdk  1.7 2、安装zookeeper 3.4.8 3、安装Python2.7X 4、安装storm0.9 5、安装git 6、安装...

    2016-08-28 22:58
    1224
  • Python快速学习第十二天--生成器和协程

    yield指令,可以暂停一个函数并返回中间结果。使用该指令的函数将保存执行环境,并且在必要时恢复。 生成器比迭代器更加强大也更加复杂,需要花点功夫好好理解贯通。 看下面一段代码: [py...

    2016-08-21 23:14
    582
  • Python快速学习第十一天--Python多线程

    Python中使用线程有三种方式: 方法一:函数式 调用thread模块中的start_new_thread()函数来产生新线程。语法如下: thread.start_new_thread ( f...

    2016-08-21 16:33
    1086
  • Python快速学习第十天

    11.1 打开文件 open函数用来打开文件,语法如下: open(name[, mode[, buffering]]) open函数使用一个文件名作为唯一的强制参数,然后返回一...

    2016-08-20 11:15
    1091
  • strom之Worker、executor、task详解

    Storm在集群上运行一个Topology时,主要通过以下3个实体来完成Topology的执行工作: 1. Worker(进程) 2. Executor(线程) 3. Task 下图简要描...

    2016-08-19 15:57
    1317
  • Python快速学习第九天--安装并操作Mysql数据库

    python操作mysql数据库 Python 标准数据库接口为 Python DB-API,Python DB-API为开发人员提供了数据库应用编程接口。 Python 数据库接口支持非常多的数...

    2016-08-18 10:19
    1264
  • Python快速学习第八天

    本文内容全部出自《Python基础教程》第二版 10.1 模块 现在你已经知道如何创建和执行自己的程序(或脚本)了,也学会了怎么用import从外部模块获取函数并且为自己的程序所用: >>> ...

    2016-08-17 15:49
    1268
  • Python快速学习第七天

    本文内容全部出自《Python基础教程》第二版 在Python中,有的名称会在前面和后面都加上两个下划线,这种写法很特别。前面几章中已经出现过一些这样的名称(如__future__),这种拼...

    2016-08-16 14:52
    1300
  • Python快速学习第六天

    第六天: 面向对象   1. 面向对象的特点——多态,封装,继承    对象:包括特性和方法,特性只是作为对象的一部分变量,而方法则是存储在对象内的函数。 (1)多态——对不同类的对象,使...

    2016-08-15 14:30
    1123
  • Python快速学习第五天

    第五天:抽象 1、    函数 检测函数是否可调用:callable >>> import math >>> y=math.sqrt >>> callable(y) True >>>...

    2016-08-14 22:21
    1110
  • Python快速学习第四天

    第四天: 条件 、循环和其他语句 1、    print 使用逗号输出 - 打印多个表达式也是可行的,但要用逗号隔开 >>> print 'tanggao ',20 tanggao  2...

    2016-08-14 11:18
    1020
  • Python快速学习第三天

    第三天: 字典 什么是字典? 字典是Python语言中唯一的映射类型。 映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的哈希表。 字典对象是可变的,...

    2016-08-13 13:33
    601
  • Python快速学习第二天

    第二天   字符串的使用 1、字符串格式化       a)    %s格式化为字符串   >>> format ="Hello, %s. %s enough for ya?" >>> ...

    2016-08-12 17:17
    27139
  • Python快速学习第一天

    第一天: Python是一种解释型的、面向对象的、带有动态语义的高级程序设计语言   一、运行Python: 1、 在交互式环境下,直接输入Python进入Python编程环境   [root@ta...

    2016-08-12 10:21
    889
  • storm一致性事务

    Storm是一个分布式的流处理系统,利用anchor和ack机制保证所有tuple都被成功处理。如果tuple出错,则可以被重传,但是如何保证出错的tuple只被处理一次呢?Storm提供了一套事务性...

    2016-07-23 23:43
    1668
  • storm的数据流组

    数据流组 设计一个拓扑时,你要做的最重要的事情之一就是定义如何在各组件之间交换数据(数据流是如何被bolts消费的)。一个数据流组指定了每个bolt会消费哪些数据流,以及如何消费它们。 N...

    2016-07-23 16:04
    2213
  • strom架构和构建Topology

    一、Storm基本概念 在运行一个Storm任务之前,需要了解一些概念: Topologies Streams Spouts Bolts Stream groupings Reliability...

    2016-07-23 15:22
    1847
img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部