自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 mac 下用brew快速安装CommandLineTools

快速安装brew 解决CommandLineTools问题

2023-07-31 10:37:14 1897

原创 hive 常用的日期维度

常用的日期维度

2023-05-31 11:43:31 170

原创 presto 实现 多行转多列

SELECT kv['20200101'] AS dt1, kv['20200102'] AS dt2, kv['20200103'] AS dt3FROM ( SELECT map_agg(dt, cnt) kv FROM a GROUP BY 1) tpresto 实现 列转行SELECT t1.uid, t2.key, t2.valueFROM a as t1CROSS JOIN unnest ( array['dt1', 'dt2', 'dt3']...

2022-03-29 20:30:26 1388

原创 python 数组

import numpy as npa=[1,2,3.4,5,7,8]print(a)[ 1 2 3 4 5 ]print(a[-1]) 取最后一个元素结果:[5]print(a[:-1]) 除了最后一个取全部结果:[ 1 2 3 4 ]print(a[::-1]) 取从后向前(相反)的元素结果:[ 5 4 3 2 1 ]print(a[2::-1]) 取从下标为2的元素翻转读取结果:[ 3 2 1 ]print(a[1:]) ...

2022-03-29 20:27:02 769

原创 pip 超时问题

在python中我们经常会用pip安装一下工具包,有时候会出现网络等问题出现超时等情况,我们可以设置超时参数来防止程序无限的等待等。pip3 install \--default-timeout=3600 \

2021-11-23 16:49:21 677

原创 hive挂分区修复

我们在工作中可能会遇见 一个表中 多分区 ,我们从hdfs中直接上传分区文件后我们需要执行alter table dm.test add partition(dp='xxx')location 'hdfs://ns/dm.db/test/dp=xxx/元数据才会记录。工作中我们会直接上传一个hdfs 文件没有执行挂分区的操作,导致数据查询丢失数据。解决方案:msck repair table dm.test这样元数据就会记录...

2021-09-27 20:35:14 306

原创 hive多行转置

在工作中我们会遇见类似转置的需求 我们可以通过以下方法解决:with a as (select '20200101' as dt ,111 as cntUNION allselect '20200102' as dt ,1 as cntUNION allselect '20200103' as dt ,89 as cnt)select dt_map['20200101'],dt_map['20200102'],dt_map['20200103']from ( select...

2021-09-01 10:29:32 459

原创 spark -- repartition和coalesce区别

我们都知道coalese 和repartition都是对数据再划分但是有时候用的时候还是有区别的我们从源码把主要部分拿来比较:coalesce(numPartitions:Int,shuffle:Boolean=false)而repartition 是去执行coalesce(numPartitions, shuffle = true)这里我们我们看出来repartitionshuffle = true 而coalesce为false我们来通过具体例子来分析我们对两个算子的应用场景:.

2021-08-02 16:52:06 410

原创 mysql 请求乱码问题

1:mysql请求的时候我们有时候需要告诉客户端r使用什么字符集我们可以通过命令:>show variables like 'character%'来查看相关默认字符集比如| Variable_name | Value |+--------------------------+-----------------------------------.

2021-07-15 16:55:08 85

原创 mysql 有关数组json解析

1:在mysql中若元素类型为text 但存储的是一个数据组时,相对其他hive oracle 等mysql处理稍显复杂,下面为在项目中遇见的问题:比如 表 B中 有字段班级id 和 student 其中student 为text 类型 存储的为班级内所有学生的信息比如 [{'name':'a','age':23},{'name':'a','age':10},{'name':'a','ag...

2020-04-21 15:56:52 568

原创 HIVE中Grouping sets 时遇见的问题

hive 中使用grouping SETS时遇见对坑:hive报错Grouping sets aggregations (with rollups or cubes) are not allowed if aggregation function parameters overlap with the aggregation functions columnsselect p.c...

2020-04-10 15:27:00 3096

原创 HIVE常见的分析开窗函数

withdanke_bi_tmp.f_bi_lsq_ana_testas(SELECTroom_codeasid ,sign_date,pricefrom 库名.表明wherep_day =CURRENT_DATE+INTERVAL'-1'dayandcity_name ='成都市')/* following向下寻找 preceding 向上寻找 ...

2020-01-15 11:52:19 256

原创 ketlle 局部变量实现步骤

在我们做ETL过程中我们经常需要动态参数的情况,比如我们在分表中,我们需要把每个月的数据写入相应的数据表中比如test_201901 ,test_201902所以在用kettle 中我们可以通过一以下方式实现:首先我们知道设置变量 在当前转换中引用 ,所以我们现在job中实现过程如下在设置变量的转换中设置变量:然后在下面的数据转换中我们就可以直接用上...

2019-11-20 15:32:46 339

原创 hive 脚本传参数跑批数据 本月数据循环写入

本脚本主要是本月一号到目前日期循环写入 1号--昨天。 2号--昨天 等等数据#!/bin/sh. /etc/profiletime= date -d 0day +%Y%m%dfirst=`date +"%Y-%m-01"`second=`date -d -1day +%Y-%m-%d`while [ "$first" != "$second" ]doecho $firstec...

2019-10-15 19:23:27 1572

原创 根据经纬度计算两点的距离

SELECT111.199*sqrt((f.lng-e.lng)*(f.lng-e.lng)+(f.lat-e.lat)*(f.lat-e.lat)*cos((f.lng+e.lng)/2)*cos((f.lng+e.lng)/2)) as distancefrom fleft join e on 条件

2019-07-30 11:15:40 144

原创 hive 中判断中文的表达式

select regexp_extract('这里china', '[\u4e00-\u9fa5]+', 0)输出结果为:这里select regexp_replace('2019这里china', '[\u4e00-\u9fa5]+', "")输出结果为:2019china

2019-07-30 11:09:36 9206

原创 informatic动态变量的创建和使用

1.在informatic 使用过程中我们有时候需要一个动态的变量去作为一个判断的条件。在使用过程中自己使用的经历如下1.1首先我们需要要创建一个变量:在这里不得不提醒一下 is expression variable 这个属性需要设置为false 时在引用时有效,我们可以在这里给这个变量赋初始值。1.2 在maping中我们这用过这个变量的时候需要修改一下这个变量的执行值。比如下...

2018-03-30 17:05:31 1583 1

原创 swift 属性(willSet与didSet)

在学习中 看见了willset  这个词就去查了一下  class People : NSObject{//普通属性var firstName:String = ""var lastName:String  = ""var nickName:String  = ""//计算属性var fullName:String{g

2016-08-04 13:49:52 367

原创 swift3 基础语法(mutating)

使用 mutating 关键字修饰方法是为了能在该方法中修改 struct 或是 enum 的变量,在设计接口的时候,也要考虑到使用者程序的扩展性。所以要多考虑使用mutating来修饰方法。struct SimpleStruct: ExampleProtocol {var simpleDescription: String = "A simple structure"

2016-08-04 13:49:10 1432

原创 有关ios硬件的部分的

/* @abstract 获取当前语言环境 */+(NSString*)deviceLanguages{       return [[[NSUserDefaults standardUserDefaults]objectForKey:@"AppleLanguages"]objectAtIndex:0];   }/* @abstract获取当

2016-05-17 14:41:28 337

原创 有关ios健康记步的算法

//.首先ios7以上的系统  有运动协处理器的设备  用户必须是允许读取健身数据的前提下 if ([CMStepCounterisStepCountingAvailable]) {       NSCalendar *calendar = [NSCalendarcurrentCalendar];               NSDate *now = [NSD

2016-05-17 14:30:27 923

原创 UML的简单认识

Unified Modeling Language (UML)又称统一建模语言或标准建模语言UML规范用来描述建模的概念有,类(对象的)、对象、关联、职责、行为、接口、用例、包、顺序、协作,以及状态。面向对象的分析与设计(OOA&D,OOAD)UML由3个要素构成:UML的基本构造块、支配这些构造块如何放置在一起的规则和运用于整个语言的公用机制。UML有3种基本的构

2016-05-17 14:26:58 583

原创 ios倒计时

- (void)timerFireMethod:(NSTimer *)theTimer{    longlong t = self.nowTimeStr.intValue +1;    NSNumber *Number = [NSNumbernumberWithLongLong:t];    self.nowTimeStr = [NSStri

2016-05-11 15:27:35 388

转载 后台长存的ios

#import-(BOOL)a(UIApplication*)application didFinishLaunchingWithOptions:(NSDictionary*)launchOptions {#warning这是为了后台保存长存的代码//    NSError *setCategoryErr = nil;//    NSEr

2016-05-11 15:25:58 215

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除