hadoop
wzdprofessor
保持大局观!
展开
-
hadoop集群监控ganglia简单安装配置
环境: 系统:centos7 nginx:1.8.1 php:5.4.16 ganglia:3.7.2 安装:这里使用yum安装 1.安装epel: yum install epel-release 2.安装gmond: yum install ganglia-gmond -y 3.安装gmetad: yum install ganglia-gmetad -y ...原创 2018-08-17 12:18:59 · 222 阅读 · 0 评论 -
hive 1.2.2安装配置
1.下载hive: wget http://mirrors.hust.edu.cn/apache/hive/hive-1.2.2/apache-hive-1.2.2-bin.tar.gz 2.解压到指定目录: tar zxf apache-hive-1.2.2-bin.tar.gz -C /usr/local/ cd /usr/local/ mv apache-hive-1.2....原创 2018-08-31 01:29:51 · 707 阅读 · 0 评论 -
pyspark获取ip地址的位置信息
#coding=utf-8 from pyspark import SparkConf,SparkContext conf=SparkConf().setAppName("getiplocal").setMaster("local[*]") sc=SparkContext(conf=conf) #指定从哪里读取数据 #1.规则,ipnum rdd1 = sc.textFile("hdfs://...原创 2018-09-03 18:25:05 · 473 阅读 · 0 评论 -
在windows10本地运行wordcount程序报错
错误展示: null chmod 0700 D:\tmp\hadoop-darren\mapred\staging\darren959377275\.staging 解决办法很简单,访问下面的url,得到2.7.3文件bin下的hadoop.dll,将其拷贝到windows\system32下搞定 https://github.com/SweetInk/hadoop-common-bin...原创 2018-08-31 17:28:20 · 845 阅读 · 0 评论 -
pyspark统计access访问日志中ip的归属地(用本地ip地址库)
本地ip地址库:不足之处便是数据不准确,而且数据变化不能实时更新。 第三方ip地址接口:解决了上面的问题,但是查询量太大的话会拒绝服务。 本实例演示的是本地ip地址库,数据格式为:(下载地址:https://download.csdn.net/download/wangjiadongge/10644936) 62610,1034939648,61.175.237.0,1034939657,...原创 2018-09-04 14:43:51 · 438 阅读 · 0 评论 -
zookeeper启动脚本
#/bin/sh #for start or stop zookeeper a=$1 if [[ $a = "start" ]];then for host in node1 node2 node3 do ssh $host "export JAVA_HOME=/usr/local/jdk;/usr/local/zookeeper-3.4.5...原创 2018-09-04 23:06:31 · 354 阅读 · 0 评论 -
spark RDD算子大全
Transformation Meaning map(func) Return a new distributed dataset formed by passing each element of the source through a function func. filter(func) Return a new dataset formed by selecti...原创 2018-09-02 12:21:07 · 993 阅读 · 0 评论 -
hive创建一个自定义函数处理复杂数据
1.数据格式实例: ------------------------------------- 1,zhangsan:18:beijing|nan|it,2000 2,lisi:28:nanjing|nan|it,4000 3,xiaowu:38:qingdao|nan|it,1000 -------------------------------- 创建表,然后load到hive中: ...原创 2018-09-05 15:37:21 · 978 阅读 · 0 评论