BI工程师
文章平均质量分 91
1
种一棵树001
这个作者很懒,什么都没留下…
展开
-
Oracle查询(下)
当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。–优点:分区表的优点–缺点:没有maxvalue时,找不到对应的分区会报错,有maxvalue时,随着时间的变长,该分区的数据会越来越多,失去了分区的意义。–间隔分区 (分区只能使用== 日期类型 或者 数字类型==)–是范围分区的升级版本,或者特殊范围分区。原创 2024-09-20 21:07:30 · 1388 阅读 · 0 评论 -
hadoop大数据平台操作笔记(下)
自定义函数分为UDF、UDAF、UDTF三个部分:UDF输入一行数据,输出一行数据;UDAF输入多行数据,返回一行或者多行;UDTF输入一行数据,输出多行数据。在Hive的统计过程中,经常会遇到数据量很大的表格,使用group by之类的统计语句运行的时间很长或者造成性能问题之类的,或者数据本身很复杂的,例如嵌套层次很多的json之类的,我们就会使用自定义函数来辅助进行数据的统计和计算。hive可以结合python或者java进行自定义函数的编写。2,85734837。原创 2024-09-26 15:01:36 · 452 阅读 · 0 评论 -
hadoop大数据平台操作笔记(上)
对于数据内容的解释以及结构的定义。如果数据是一个表格,那么元数据就是表格的名字、位置、字段名、字段的数据类型等信息。原创 2024-09-21 18:31:49 · 1285 阅读 · 0 评论 -
Linux:shell脚本笔记
1.shell脚本默认所有变量都是字符串,定义方法同python,变量值里有空格必须加引号,否则不用加2.在定义变量的时候,不能随便添加空格,整个shell脚本对于空格的使用都是非常严格的3.在读取变量的时候,要使用${变量名} 或者$变量名 来对变量进行读取和引用。语法function 函数名(){代码块return 返回值不写参数,小括号是为了与其他语言匹配。原创 2024-09-20 20:37:45 · 842 阅读 · 0 评论 -
Oracle 查询(上)
(select sno,cno,score,sum(score) over(partition by sno) 总分, round(score/sum(score) over(partition by sno)*100)||'%' 单科占比 from sc_a02) a。select sno,to_char(avg(score),'fm999') 平均分 ,to_char(sum(score),'fm999') 总分 from SC_A02 group by SNO;原创 2024-09-05 13:44:54 · 943 阅读 · 0 评论 -
数据库:PL/SQL
dbms_output.put_line('对折次数:'||v_count||' 纸张厚度:'||v_houdu);dbms_output.put_line('对折次数:'||v_count||' 纸张厚度:'||v_houdu);dbms_output.put_line('天数:'||v_day||' 存款:'||v_deposit);dbms_output.put_line('存款天数:'||v_day||' 存款:'||v_deposit);原创 2024-09-13 11:11:13 · 831 阅读 · 0 评论