- 博客(19)
- 资源 (1)
- 收藏
- 关注
转载 ks-test
Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max| f(x)- g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设。KS检验与t-检验之类的其他方法不同是KS检验不需要知道数据的分布情况,可以算是一种非参数检验方法。当然这样方便的代价就是当检验的数...
2019-07-31 10:29:17 4390
原创 汇总平均数/比值的坑
A城市:每天车总订单100(total_ord),一共20个车(total_vid),因此每天的车均单是5(avg_ord)B城市:每天车总订单300,一共30个车,因此每天的车均单是10在计算全国(假设只有A+B两个城市)简单的车均单加总处以2即(10+5)/2=7.5,对应sql里面avg(avg_ord)但是分开算真实的是:(100+300)/(20+30)=8,对应sql的...
2019-07-30 20:58:09 1567
原创 Hive日期函数
模块 Hive时间函数特别注意 要点 除了unix_timestamp/from_unixtime之外 其他函数无法识别‘年-月’形式,至少‘年-月-日’ to_date 注意to_date就是返回年-月-日,和day(‘2019-07-02’)返回02不一样 ...
2019-07-29 10:31:15 6695
转载 lag/lead
lag 和lead 可以 获取结果集中,按一定排序所排列的当前行的上下相邻若干offset 的某个行的某个列(不用结果集的自关联);lag ,lead 分别是向前,向后;lag 和lead 有三个参数,第一个参数是列名,第二个参数是偏移的offset,第三个参数是 超出记录窗口时的默认值)举例如下:SQL> select * from kkk;...
2019-07-25 20:28:06 1133
原创 自连接--子查询的另一种方式
CREATE TABLE cust(cust_id INT NOT NULL ,cust_name VARCHAR(50) NOT NULL,cust_concat VARCHAR(50) NOT NULL);INSERT INTO cust(cust_id,cust_name,cust_concat) VALUES (1001,'kylin','Mary');INSERT IN...
2019-07-24 15:29:26 671
原创 文本函数/数学函数/日期函数/indirect函数/条件格式
关键点在于如何在横纵向列表上都应用到row,column函数公式=index($A:$A,row()*3+column()-截距)因为row上是3倍3倍增加的,column还是一倍一倍增加的;所以一个乘3一个不变,最后加起来~!条件格式:...
2019-07-17 17:58:53 728
转载 if{1,0}
if({1,0}是利用常量数组作为IF函数的第1个参数,实现构建新的两列数组的用法。想彻底了解它,我们还得从IF函数的基本用法说起~~=IF(A1>=0,"正数","负数"),这个很容易理解,如果条件成立,就返回后面第一个值,条件不成立就返回第二个。A1>=0(条件表达式)的结果只有两种:A1的值>=0时,结果是TRUE,否则结果是FALSE,而在IF结构中,所...
2019-07-15 10:51:00 9287
原创 lookup
这里注意数组1.{= sum((E3:E11)*(F3*F11))}代表数组运算ctrl+enter+shift,因为(E3:E11)*(F3*F11)返回的是数组2.= sum(E3:E11)其中E3:E11也是数组但是直接enter就可以‘为什么:因为(E3:E11)是本来就存在的列,(E3:E11)*(F3*F11)是运算出来的内存有的,中间产物,必须ctrl+ente...
2019-07-15 10:09:44 514
原创 vlookup/match与index
参考链接:https://www.zhihu.com/question/27224727/answer/608904047绝对引用/相对引用/混合引用A$1:固定行,列可变,所以横向展开可变,竖向展开不变$A1:固定列,行可变,上下拉(本来就是a1,a2,a3,a4)所以会变 但是左右拉(本来a1,b1,c1,d1..)但是现在固定了a,从而横向...
2019-07-15 10:07:38 468
原创 if/countif/sumif/averageif
averageifAVERAGEIF函数含义:返回某个区域内满足给定条件的所有单元格的平均值。AVERAGEIF函数语法:=AVERAGEIF(条件区域,条件,求平均值的区域)...
2019-07-15 10:02:12 657
原创 分类汇总/数据有效性/数据透视表
更多数据透视表的知识https://zhuanlan.zhihu.com/p/36785151http://www.360doc.com/content/18/0527/19/13664199_757490624.shtml注意分类汇总和数据透视表不一样,分类汇总是在原表里每一个类别汇总下面有一个汇总~...
2019-07-15 09:49:57 892
原创 查找替换定位/排序筛选
工资条问题如下,L就代表辅助排序列上边代表且:部门是财务部而且发生额大于3000;下面一车间或二车间大于300或大于10000
2019-07-15 09:44:50 335
原创 tab表计算
表计算类型:汇总/差异/百分比差异/总额百分比/排序/百分位 etc表计算依据:表(横穿):范围:一行之间所有单元格比较;方向:一行内从左到右(计算差值的时候第二个减第一个表(向下):范围:一列之间所有单元格比较;方向:一列内从上到下(计算差值的时候第二个减第一个表(横穿,然后向下):范围:整个表所有单元格比较;方向:一行内从左到右,然后走蛇字形(计算差值的时候第二个减第一个表...
2019-07-12 11:23:57 376
转载 tab面试
1.https://mp.weixin.qq.com/s?__biz=MzAxNTc3MDEwOA==&mid=2247483914&idx=1&sn=f82a188db97f95382041ccc85f31d1f2&chksm=9bfe4a99ac89c38f6196e294e22a1905d1f74dd0c4247313e9e94f53c4552b149cf80...
2019-07-12 10:17:22 181
原创 tab筛选器
详情见:https://www.jianshu.com/p/02114bbeb4a7参数+计算字段的使用见:https://www.jianshu.com/p/3cce9a340f70
2019-07-12 10:14:55 279
原创 tab函数
include没有对订单id之外的维度视而不见,而fixed会对除了商品id之外的维度视而不见更多关于fix/exclude的内容见:https://www.jianshu.com/p/790f6b4cc440更多关于R与tableau结合的内容见:https://blog.csdn.net/wenyusuran/article/details/80506800...
2019-07-11 14:28:15 684
原创 行列转换
1.变换结果集成一行create table test3 ( deptno int not null, cnt int not null );insert into test3 values (10,3);insert into test3 values (20,5);insert into test3 valu...
2019-07-03 11:11:31 1959
原创 sql关于avg中的else null和else 0
drop table test1;use sys;create table test1 ( id int not null, num int not null );insert into test1 values (1,10);insert into test1 values (2,20);insert into test1 values (3,3...
2019-07-02 09:45:09 1113
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人