hadoop
pete1223
这个作者很懒,什么都没留下…
展开
-
20180423-hdfs
### 1.[volatile和synchronized的区别与联系](#1)### 2.[hdfs](#2)### 3.[yarn](#3)### 4.[乐观锁和悲观锁](#4)<span id="1" style="font-size: 20px;">```1. volatile本质是在告诉jvm当前变量在寄存器(工作内存)中的值是不确定的,需要从主存中读取;synchronize...转载 2018-04-24 14:49:22 · 182 阅读 · 0 评论 -
hadoop 2.7.2引入第三方jar包
1、发现一个不错的解决方案:http://algoarch.iteye.com/blog/1142681 2、英文地址:http://www.blowide.com/2010/04/including-external-jars-in-a-hadoop-job/ 3、可问题来了,里面描述的lib目录建在哪里?执行时到底怎么调用的呀? ...转载 2018-04-27 10:52:33 · 1542 阅读 · 0 评论 -
spark 写文件到hive
import java.io.Fileimport org.apache.hadoop.hive.ql.io.HiveFileFormatUtilsimport org.apache.spark.rdd.RDDimport org.apache.spark.sql.{DataFrame, SaveMode, SparkSession}object TestSparkSQLHive {...原创 2018-07-18 18:52:28 · 2611 阅读 · 0 评论 -
idea maven Scala全依赖打包
<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://原创 2018-07-25 11:46:58 · 3276 阅读 · 0 评论 -
FSImage CheckPoint
什么时候进行checkpoint什么时候进行checkpoint由两个参数dfs.namenode.checkpoint.preiod(默认值是3600,即1小时)和dfs.namenode.checkpoint.txns(默认值是1000000)来决定。period参数表示,经过1小时就进行一次checkpoint,txns参数表示,hdfs经过100万次操作后就要进行checkpoint了...转载 2018-12-05 12:48:33 · 313 阅读 · 0 评论 -
hadoop mapreduce job.splitmetainfo does not exist错误解决
For more detailed output, check application tracking page:http://s101:8088/cluster/app/application_1564489361939_0001Then, click on links to logs of each attempt.Diagnostics: File file:/home/hadoop/...原创 2019-07-31 16:30:39 · 1293 阅读 · 0 评论 -
HIve UDAF create temporary function 找不到文件解决
问题描述:create temporary function getMax as 'comhadoopcourse.GenericUDAFFindMaxPair';FAILED: Class com.hadoopcourse.GenericUDAFFindMaxPair not found解决方式:由于使用idea maven打jar包的方式进行打包索引要删除对应jar...原创 2019-08-01 14:31:13 · 712 阅读 · 1 评论