- 博客(28)
- 收藏
- 关注
原创 【FINEBI】finebi中常用图表类型及其适用场景
比较不同类别或组之间的数量差异:柱状图可以用于比较不同产品、地区、时间段等的销售额、市场份额等。发现不同变量之间的相对优势和劣势:通过比较不同雷达图的形状和面积,可以了解各个方面的表现情况。识别数据中的模式或异常值:通过观察散点的分布情况,可以发现数据中的聚集、趋势或离群点。比较不同类别之间的相对大小:通过比较不同扇形的大小,可以了解各个类别的相对重要性。比较不同渠道或产品的转化率:通过比较不同漏斗的宽度,可以了解各个环节的转化率情况。与柱状图类似,适用于比较不同类别之间的数量差异。
2024-01-22 10:26:12 2012
原创 【HIVE】HiveQL数据查询 2
查看Hive所有内置函数:查看内置函数的用法:查看函数用法的详细信息,系统中会给出实例:Hive的内置函数包括。::::2.Hive分桶表与分区表相比,分区表是粗粒度划分,分桶表则是更细粒度的划分,分桶表将数据内容按照某列属性值的哈希值进行区分。例如按照用户ID属性进行分桶,分为3个桶,就是对用户ID属性值对3取模运算,按照取模结果对数据进行分桶。所以,分桶的规则就是对分桶字段值进行取哈希值,然后用该哈希值除以桶的个数取余数,余数决定了该条记录会被分在哪个桶中。余数相同的记录会分在同一个
2023-12-13 11:20:06 394
原创 【HIVE】HiveQL数据查询 1
在Hive中,order by与SQL中定义一致,而增加了SORT BY语句,会在每个reducer中对数据排序,也就是会执行一个局部排序,可以保证每个reducer的输出数据都是有序的(并非全局有序),可以提高后续进行全局排序的效率。两个关键字都可以使用ASC、DESC关键字进行升降排序。选择建议:数据量级大时选择SORT BY,量级小用ORDER BY。
2023-12-13 00:52:54 584
原创 【HIVE】数据的定义与操作
Hive作为数据仓库,用来存放企业的海量数据,Hive提供了丰富的数据类型,如关系型数据库,且提供了关系型数据库不支持的数据类型。
2023-12-11 21:14:07 1361
原创 【Ubuntu】windows11与ubuntu22.04共享文件夹的创建与挂载
3.打开文件管理器,可以看到,已经挂载成功,可以正常显示windows端的共享文件夹。1.在win11上需要的位置新建文件夹,作为共享文件夹。1.在任意位置新建文件夹,用以关联win11共享文件夹。2.执行挂载命令(执行时最好使用sudo)2.在VMware中,编辑虚拟机设置。”,并选取作为win11端共享文件夹的。”,“文件夹共享”处选择“3.在虚拟机设置的“
2023-12-11 00:24:29 1176
原创 【HIVE】count(*) sum() 报错:Error during job, obtaining debugging information...
在命令行中看不到具体的错误信息,需要在Hadoop YARN平台可视化web界面找到日志记录。在HIVE查询数据过程中,出现count()、sum()的汇总函数时,查询失败,报以下错误。
2023-12-10 19:46:23 943 1
原创 【PowerBuilder】PowerBuilder常用函数
PowerBuilder是一种集成开发环境,具有自己的编程语言和函数库。以下是PowerBuilder中一些常用的函数及其示例代码
2023-06-06 14:27:42 2429
原创 【Python】Pandas的基本功能及使用人群
Pandas对数据的处理是为数据分析服务的,它所提供的各种数据处理方法、工具是基于数理统计学的,包含了日常应用中的众多数据分析方法。我们学习它不仅要掌控它的相应技术,还要从它的数据处理思路中学习数据分析的理论和方法。特别地,如果你想要成为数据分析师、数据产品经理、数据开发工程师等与数据相关的工作者,学习Pandas能让你深入数据理论和实践,更好地理解和应用数据。...
2022-07-17 08:43:58 1264 1
转载 结构化数据与非结构化数据有什么区别?
结构化数据也被成为定量数据,是能够用数据或统一的结构加以表示的信息,如数字、符号。除了存储在关系数据库和存储非关系数据库之外的明显区别之外,最大的区别在于分析结构化数据与非结构化数据的便利性。非结构化数据本质上是结构化数据之外的一切数据。比如物联网、工业4.0、视频直播产生了更多的非结构化数据,而人工智能、机器学习、语义分析、图像识别等技术方向则更需要大量的非结构化数据来开展工作。客户如何选择不是基于数据结构,而是基于使用它们的应用程序关系数据库用于结构化数据,大多数其他类型的应用程序用于非结构化数据。..
2022-07-17 08:06:44 2767
原创 【Oracle】触发器
触发器是一种特殊类型的存储过程,其基本定义形式与存储过程和函数类似,唯一不同的就是所有的存储过程和函数均需用户显示调用,而触发器是当某个特定事件发生时,由系统自动调用执行,不能接收参数,即触发器是自动隐式运行的。特定事件通常是指对数据库对象的某个操作,如对数据库表进行的DML操作或对视图进行的类似操作,同时Oracle还将触发器的功能扩展到对如数据库的启动与关闭等事件的触发,所以触发器常用来完成数据库完整性约束难以完成的复杂业务规则的约束,或监视对数据库的各种操作。DML触发器主要由DML语句进行触发,当用
2022-07-11 12:54:12 2782
原创 【Oracle】包
在PL/SQL程序开发中,为了方便实现模块化程序的管理,可以将PL/SQL元素(如存储过程、函数、变量、常量、自定义数据类型、游标等)根据模块的程序结构组织在一起,存放在一个包中,称为一个完整的单元,并在编译之后存储在数据库服务器中,作为一种全局结构,供应用程序调用。在Oracle数据库中,包有两类,一类是系统内置的包,每个包实现特定的应用过程、函数、常量等的集合,如DBMS_OUTPUT.put_line()就是调用了DBMS_OUTPUT包中的put_line()函数;另一类是根据应用需要由用户创建的包
2022-07-10 14:26:16 1487
原创 【Oracle】函数
函数又称为存储函数、存储结构,用户定义的函数可以被SQL语句或PL/SQL程序直接调用。函数与存储过程的不同之处在于函数有一个显式返回值,而存储过程只能依靠OUT或IN OUT返回数据。语法:RETURN语句用于指明函数返回值的类型,但不能约束返回值的长度、精度等。在BEGIN函数体中,必须至少包含一个RETURN语句指明函数返回值。函数可以在SQL语句的以下部分调用:–创建无参函数–创建有参函数–无参函数的调用– 在pl/sql语句块中的调用–有参函数的调用–在PL/SQL语句块中的调
2022-07-08 11:20:30 1097
原创 【Oracle】存储过程
在PL/SQL程序中,除匿名块以外,还有一类被命名的PL/SQL程序块,称为存储子程序。存储子程序以编译的形式存储在数据库服务器中,可以在应用程序中进行多次调用,是PL/SQL程序模块化的一种体现。PL/SQL存储子程序包括存储过程和(存储)函数两种。存储过程用于执行特定的操作,不需要返回值;函数用于返回特定的数据。在调用时,存储过程可以作为一个独立的表达式被调用,而函数只能作为表达式的一个组成部分被调用。语法:CREATE OR REPLACE表示创建或替换存储过程,如果存储过程存在则替换它,否则就创
2022-07-07 22:57:15 2086 1
原创 【Oracle】游标 显式游标与隐式游标
在使用SQL语句进行查询时,获得和处理的结果是整个查询结果集,若需要进一步查询结果中的每条数据进行业务操作,仅靠SQL语句则无法实现,所以PL/SQL提出游标概念解决此类问题。游标是一种特殊的指针,提供了对一个结果集进行逐行处理的能力。使用游标可以对结果集按行、按条件进行数据的提取、修改和删除操作。在物理结构上,游标是Oracle为用户开设的一个数据缓冲区,存放SQL语句的执行结果。在Oracle数据库中执行的每个SQL语句都有对应的单独的游标。Oracle主要由以下两种游标类型:游标主要用于对结果集中
2022-07-06 17:52:50 4209
原创 【Oracle】PL/SQL高级应用
PL/SQL的高级应用包括对存储过程、函数、包、触发器等的应用。在PL/SQL程序中,除匿名块以外,还有一类被命名的PL/SQL程序块,称为存储子程序。存储子程序以编译的形式存储在数据库服务器中,可以在应用程序中进行多次调用,是PL/SQL程序模块化的一种体现。PL/SQL存储子程序包括存储过程和(存储)函数两种。存储过程用于执行特定的操作,不需要返回值;函数用于返回特定的数据。在调用时,存储过程可以作为一个独立的表达式被调用,而函数只能作为表达式的一个组成部分被调用。存储过程和函数具有一下特点:同时,存储
2022-07-01 11:38:39 463
原创 【Oracle】PL/SQL基础
PL/SQL(procedural language extensions to SQL)是Oracle对标准SQL语言的过程化扩展,是Oracle数据库专用的一种高级程序设计语言。由于SQL语言是关系数据库的结构化查询语言,无法对数据的业务逻辑进行处理,因此Oracle数据库对SQL语言进行了扩展,在SQL语言的基础上引入了过程化的程序设计因素,包括变量、数据类型、流程控制、游标、异常处理等。这些过程化因素与SQL语言结合,开发出具有结构化和过程化的Oracle程序,创建出包括存储过程、函数、包、触发器
2022-06-30 11:52:18 382
原创 【Oracle】常用模式对象
在Oracle数据库中,用户数据是以对象的形式存在的,并以模式为单位进行组织。Oracle数据库对象又称为模式对象,最基本的模式对象是表。除此之外,常用的模式对象还包括:视图、序列、同义词和索引等。视图是一种数据库对象,是从一个或者多个数据表或视图中导出的虚表,在数据库中只有视图的定义,而不存在实际的表。视图本质就是一个查询语句,被编译之后存储在数据库字典里。视图所对应的数据并不是真正地存储在视图中,而是存储在所引用的数据表中,视图的结构和数据是对数据表(基表)的查询结果。视图有以下优势:根据视图定义复杂
2022-06-29 19:18:41 1570
原创 【Oracle】常用数据类型
Oracle 数据库内置的数据类型可分为6类:字符类型、数值类型、日期类型、 LOB 类型、二进制类型和行类型。● CHAR [( size [ BYTE[CHAR ])]:用于存储固定长度的字符串。参数 size 规定了字符串的最大长度,可选关键字 BYTE 或 CHAR 表示其长度单位是字节或字符,默认值为1B,允许最大长度为2000B。如果 CHAR 类型的列中实际保存的字符串长度小于指定的 size 大小, Oracle 将自动使用空格填满。●VARCHAR2( size [ BYTE I CHAR
2022-06-29 15:57:35 9079
原创 【Oracle】表空间、用户、权限和角色
在数据库创建时,会自动创建哪些表空间?哪个是系统默认表空间?有何作用?如何更改系统默认表空间?Oracle中权限、角色及权限与角色之间的关系:
2022-06-29 15:30:00 732
原创 SQL server筛选指定数据表包含某些名称的列
语法:SELECT OBJECT_NAME(id) 表名,name 列名 FROM syscolumns t WHERE name LIKE ‘%模糊查询元素%’ AND OBJECT_NAME(id) like ‘%表名%’
2022-06-24 15:40:08 898
原创 OLTP与OLAP
OLTP(on-line transaction processing) :联机事务处理OLAP(On-Line Analytical Processing):联机分析处理OLAP主要通过多维表单对数据进行分析、查询和报告。它不同于传统的在线事务处理(OLTP)。OLTP应主要完成对账户的交易处理,如民航售票系统、银行储蓄系统等,通常需要更新交易量,并且需要响应时间。⽽ OLAP主要用于分析当前和历史数据,以帮助领导者做出决策。其典型要求包括分析和预测银行信用卡风险、制定公司营销策略等,数量的查询操作对时
2022-06-17 15:27:58 154
原创 Kettle 8.2无法连接Oracle、Mysql、SQL Server
Driver class 'oracle.jdbc.driver.OracleDriver' could not be found, make sure the 'Oracle' driver (jar file) is installed. oracle.jdbc.driver.OracleDriverDriver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is
2022-06-15 11:26:02 510
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人