自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

转载 ks-test

Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max| f(x)- g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设。KS检验与t-检验之类的其他方法不同是KS检验不需要知道数据的分布情况,可以算是一种非参数检验方法。当然这样方便的代价就是当检验的数...

2019-07-31 10:29:17 4390

原创 汇总平均数/比值的坑

A城市:每天车总订单100(total_ord),一共20个车(total_vid),因此每天的车均单是5(avg_ord)B城市:每天车总订单300,一共30个车,因此每天的车均单是10在计算全国(假设只有A+B两个城市)简单的车均单加总处以2即(10+5)/2=7.5,对应sql里面avg(avg_ord)但是分开算真实的是:(100+300)/(20+30)=8,对应sql的...

2019-07-30 20:58:09 1567

原创 Hive日期函数

模块 Hive时间函数特别注意 要点 除了unix_timestamp/from_unixtime之外 其他函数无法识别‘年-月’形式,至少‘年-月-日’ to_date 注意to_date就是返回年-月-日,和day(‘2019-07-02’)返回02不一样 ...

2019-07-29 10:31:15 6695

转载 lag/lead

lag 和lead 可以 获取结果集中,按一定排序所排列的当前行的上下相邻若干offset 的某个行的某个列(不用结果集的自关联);lag ,lead 分别是向前,向后;lag 和lead 有三个参数,第一个参数是列名,第二个参数是偏移的offset,第三个参数是 超出记录窗口时的默认值)举例如下:SQL> select * from kkk;...

2019-07-25 20:28:06 1133

原创 自连接--子查询的另一种方式

CREATE TABLE cust(cust_id INT NOT NULL ,cust_name VARCHAR(50) NOT NULL,cust_concat VARCHAR(50) NOT NULL);INSERT INTO cust(cust_id,cust_name,cust_concat) VALUES (1001,'kylin','Mary');INSERT IN...

2019-07-24 15:29:26 671

原创 文本函数/数学函数/日期函数/indirect函数/条件格式

关键点在于如何在横纵向列表上都应用到row,column函数公式=index($A:$A,row()*3+column()-截距)因为row上是3倍3倍增加的,column还是一倍一倍增加的;所以一个乘3一个不变,最后加起来~!条件格式:...

2019-07-17 17:58:53 728

转载 if{1,0}

if({1,0}是利用常量数组作为IF函数的第1个参数,实现构建新的两列数组的用法。想彻底了解它,我们还得从IF函数的基本用法说起~~=IF(A1>=0,"正数","负数"),这个很容易理解,如果条件成立,就返回后面第一个值,条件不成立就返回第二个。A1>=0(条件表达式)的结果只有两种:A1的值>=0时,结果是TRUE,否则结果是FALSE,而在IF结构中,所...

2019-07-15 10:51:00 9287

原创 lookup

这里注意数组1.{= sum((E3:E11)*(F3*F11))}代表数组运算ctrl+enter+shift,因为(E3:E11)*(F3*F11)返回的是数组2.= sum(E3:E11)其中E3:E11也是数组但是直接enter就可以‘为什么:因为(E3:E11)是本来就存在的列,(E3:E11)*(F3*F11)是运算出来的内存有的,中间产物,必须ctrl+ente...

2019-07-15 10:09:44 514

原创 vlookup/match与index

参考链接:https://www.zhihu.com/question/27224727/answer/608904047绝对引用/相对引用/混合引用A$1:固定行,列可变,所以横向展开可变,竖向展开不变$A1:固定列,行可变,上下拉(本来就是a1,a2,a3,a4)所以会变 但是左右拉(本来a1,b1,c1,d1..)但是现在固定了a,从而横向...

2019-07-15 10:07:38 468

原创 if/countif/sumif/averageif

averageifAVERAGEIF函数含义:返回某个区域内满足给定条件的所有单元格的平均值。AVERAGEIF函数语法:=AVERAGEIF(条件区域,条件,求平均值的区域)...

2019-07-15 10:02:12 657

原创 分类汇总/数据有效性/数据透视表

更多数据透视表的知识https://zhuanlan.zhihu.com/p/36785151http://www.360doc.com/content/18/0527/19/13664199_757490624.shtml注意分类汇总和数据透视表不一样,分类汇总是在原表里每一个类别汇总下面有一个汇总~...

2019-07-15 09:49:57 892

原创 查找替换定位/排序筛选

工资条问题如下,L就代表辅助排序列上边代表且:部门是财务部而且发生额大于3000;下面一车间或二车间大于300或大于10000

2019-07-15 09:44:50 335

原创 tab表计算

表计算类型:汇总/差异/百分比差异/总额百分比/排序/百分位 etc表计算依据:表(横穿):范围:一行之间所有单元格比较;方向:一行内从左到右(计算差值的时候第二个减第一个表(向下):范围:一列之间所有单元格比较;方向:一列内从上到下(计算差值的时候第二个减第一个表(横穿,然后向下):范围:整个表所有单元格比较;方向:一行内从左到右,然后走蛇字形(计算差值的时候第二个减第一个表...

2019-07-12 11:23:57 376

转载 tab面试

1.https://mp.weixin.qq.com/s?__biz=MzAxNTc3MDEwOA==&mid=2247483914&idx=1&sn=f82a188db97f95382041ccc85f31d1f2&chksm=9bfe4a99ac89c38f6196e294e22a1905d1f74dd0c4247313e9e94f53c4552b149cf80...

2019-07-12 10:17:22 181

原创 tab筛选器

详情见:https://www.jianshu.com/p/02114bbeb4a7参数+计算字段的使用见:https://www.jianshu.com/p/3cce9a340f70

2019-07-12 10:14:55 279

原创 tab函数

include没有对订单id之外的维度视而不见,而fixed会对除了商品id之外的维度视而不见更多关于fix/exclude的内容见:https://www.jianshu.com/p/790f6b4cc440更多关于R与tableau结合的内容见:https://blog.csdn.net/wenyusuran/article/details/80506800...

2019-07-11 14:28:15 684

原创 1.tab之数据格式

2019-07-10 15:03:56 1582

原创 行列转换

1.变换结果集成一行create table test3 ( deptno int not null, cnt int not null );insert into test3 values (10,3);insert into test3 values (20,5);insert into test3 valu...

2019-07-03 11:11:31 1959

原创 sql关于avg中的else null和else 0

drop table test1;use sys;create table test1 ( id int not null, num int not null );insert into test1 values (1,10);insert into test1 values (2,20);insert into test1 values (3,3...

2019-07-02 09:45:09 1113

数据清洗入门与实践

数据清洗入门与实践数据清洗入门与实践数据清洗入门与实践

2018-08-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除