排序:
默认
按更新时间
按访问量

Hadoop伪分布安装详解+MapReduce运行原理+基于MapReduce的KNN算法实现

本篇博客将围绕Hadoop伪分布安装+MapReduce运行原理+基于MapReduce的KNN算法实现这三个方面进行叙述。 (一)Hadoop伪分布安装1、简述Hadoop的安装模式中–伪分布模式与集群模式的区别与联系. Hadoop的安装方式有三种:本地模式,伪分布模式,集群(分布)模式,...

2016-06-15 16:25:46

阅读数:9315

评论数:21

Flume架构以及应用介绍

在具体介绍本文内容之前,先给大家看一下Hadoop业务的整体开发流程: 从Hadoop的业务开发流程图中可以看出,在大数据的业务处理过程中,对于数据的采集是十分重要的一步,也是不可避免的一步,从而引出我们本文的主角—Flume。本文将围绕Flume的架构、Flume的应用(日志采...

2016-05-31 12:35:17

阅读数:86075

评论数:30

你真的会用PYTHON的装饰器了吗?(老铁)

本文结构: 无参装饰器的一般形式                a、 解决原生函数有参问题                b、解决原生函数有返回值问题 无参装饰器的模型总结 无参装饰器的具体应用实例 有参装饰器 有参装饰器的具体应用实例  对于大部分学Python的人来说,装饰器可能是遇...

2018-10-31 08:26:07

阅读数:90

评论数:2

深入掌握大数据Kafka的使用(基于Python开发)-张明阳-专题视频课程

深入掌握大数据Kafka实战视频教程,本课程为实战教学,主要介绍了Kafka的生产者、消费者,其中重点内容--消费者偏移量的处理以及再均衡问题进行了更加深入的介绍....

2018-10-29 09:34:53

阅读数:315

评论数:0

Kafka常用命令汇总

Kafka常用命令汇总: 1、列出集群里的所有主题。 kafka-topics.sh --zookeeper localhost:2181 --list [bdp_client@BJLFRZ-Client-50-162 ~]$ kafka-topics.sh --zookeeper loca...

2018-09-28 18:09:06

阅读数:50

评论数:0

Kafka消费数据的几种方式

Consumer手动指定偏移量消费: ================================================= 1、指定多主题消费     consumer.subscribe(Arrays.asList("t4",&quot...

2018-09-20 23:23:30

阅读数:150

评论数:0

PYTHON面向对象章节深入讲解-张明阳-专题视频课程

介绍了类和面向对象、 反射、静态方法和类方法、 三大特性(封装继承多态)、魔法元类、单例模式

2018-08-24 09:13:35

阅读数:16

评论数:0

Python中的元类编写ORM框架

博客转载:https://blog.csdn.net/givemefive_y/article/details/79806348

2018-08-10 20:10:03

阅读数:51

评论数:0

如果你是第一次接触Python当中的面向对象,请点击进来。

2018年7月29日15:49:49 今天有时间写一篇关于Python面向对象入门的文章,其实面向对象是不属于某一门编程语言的,而是一种编程思想,如果你是第一次接触面向对象,你需要弄懂下面几个问题: 什么是面向对象,为什么要使用面向对象? 什么是类,为什么要使用类? 类和类对象之间是什么关...

2018-07-29 15:48:45

阅读数:107

评论数:0

深入理解RabbitMQ消息队列的使用-张明阳-专题视频课程

RabbitMQ使用的详细介绍

2018-06-21 09:26:56

阅读数:15

评论数:0

Python当中普通用户权限安装第三方模块

下面教程是关于使用普通用户权限安装第三方模块,避免程序源代码需要内置第三方模块。声明:下面的方法不会对系统的原有环境造成任何影响第一种场景:系统如果安装有python3.5,可以按照下面方法创建虚拟环境[dd_edw@BJHC-Client-18511 ~]$ python3.5 -m venv ...

2018-06-16 10:45:19

阅读数:296

评论数:0

Rabbitmq中的RPC通信机制

具体工作机制:Our RPC will work like this:When the Client starts up, it creates an anonymous exclusive callback queue.For an RPC request, the Client sends a...

2018-06-04 15:19:32

阅读数:150

评论数:0

Git的基本使用-张明阳-专题视频课程

Git的基本使用(开发者)

2018-05-28 08:55:42

阅读数:11

评论数:0

Python使用PyMysql模块报错:lock wait timeout exceeded; try restarting transactio

呵呵,我只想说:关于这个问题我整了两个星期,关于这个问题的原因,从网上看到的很多文章全都是说要conn.commit(),但是我在程序里面已经commit()了,最后定位到的问题是Pymysql在多线程(或多进程下)面会有bug,对,你没听错,Pymysql模块自身的bug造成的:解决方案:利用D...

2018-04-28 15:28:32

阅读数:291

评论数:0

Python第三章模块-张明阳-专题视频课程

介绍Python在项目当中常用的模块:logging日志模块、子进程subprocess模块、时间模块 、re模块、os与sys模块、json和pickle模块、configparser模块、hashlib模块

2018-04-20 17:51:28

阅读数:9

评论数:0

Python中模块的搜索路径实例讲解

2018年3月1日13:26:09最近在工作的时候遇到一个问题,我首先是拿到别人现成的代码,代码如下:import os,sys,re import datetime import threading import subprocess import configparser import sen...

2018-03-01 13:33:36

阅读数:222

评论数:0

Python第二章包入门实战-张明阳-专题视频课程

本次视频重点介绍了Python中包的相关知识:模块、包、绝对导入与相对导入等等

2018-02-11 16:43:09

阅读数:12

评论数:0

Hive内部表、外部表、分区表以及外部分区表创建以及导入数据实例讲解

源数据格式: [dd_edw@BJHC-Client-144113 zhang_dd_edw]$ more data.txt 25502#hdfs://ns1/user/dd_edw/adm.db/adm_dealer_order_list_di_big/dt=2015-07-15 2549...

2018-01-08 11:11:40

阅读数:479

评论数:0

Python中的多进程小示例

#!/usr/bin/python # -*- coding:utf-8 -*-import requests import json import timefrom multiprocessing import Pooldef func(name): print('********%s'...

2017-12-31 16:43:18

阅读数:248

评论数:0

K-means算法

算法核心步骤: K-means聚类的方法也叫K均值聚类,聚类的方法有许多中,其中K-mens可能是最常用到的方法。1 算法的优缺点: 优点 缺点 使用简单 因为它使用了一个随机的元素,所以它不能保证找到最佳的类 无 需要一个合理初始化要聚类的个数:即要初始化K2...

2017-12-28 23:00:31

阅读数:206

评论数:0

提示
确定要删除当前文章?
取消 删除