自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(231)
  • 资源 (4)
  • 问答 (1)
  • 收藏
  • 关注

原创 数据库工程师的几个发展方向

从事数据库相关工作已经十几年了,是因为自己内心的执着,一直执着于从事的oracle数据库的相关工作。我是从erp起步的,从技术难度上来说erp的开发不是特别难,数据库的数据量也不是很大,可以作为刚步职场的一个过渡阶段。如果从事erp开发,核心要掌握的就是存储过程的编写,因为大部分公司写后台都是用的存储过程,同时做erp开发的话如果感兴趣的话可以多学习些数据库设计发面的内容,比如表的设计,表与表关系......

2019-09-06 10:57:02 4967

原创 10亿数据最快速批量插入Mysql的方式

执行结果如图所示:图片其中Table表示表名,Create Table就是我们需要看的建表信息,将数据展开:图片我们能够看到非常完整的建表语句,表名、字段名、字段类型、字段长度、字符集、主键、索引、执行引擎等都能看到。除此之外,我们还可以使用:instr和position函数,它们的功能跟locate函数类似,在这里我就不一一介绍了,感兴趣的小伙伴可以找我私聊。执行结果:图片使用group_concat函数,可以轻松的把分组后,name相同的数据拼接到一起,组成一个字符串,用逗号分隔。

2025-06-12 09:39:30 398

原创 mysql 数据库常用函数的使用

执行结果如图所示:图片其中Table表示表名,Create Table就是我们需要看的建表信息,将数据展开:图片我们能够看到非常完整的建表语句,表名、字段名、字段类型、字段长度、字符集、主键、索引、执行引擎等都能看到。除此之外,我们还可以使用:instr和position函数,它们的功能跟locate函数类似,在这里我就不一一介绍了,感兴趣的小伙伴可以找我私聊。执行结果:图片使用group_concat函数,可以轻松的把分组后,name相同的数据拼接到一起,组成一个字符串,用逗号分隔。

2025-06-12 09:34:52 464

原创 Oracle中10个索引优化

Oracle数据库作为一个功能强大的企业级数据库系统,对于索引的优化有着丰富的技巧和方法。无具体示例代码,但可以通过Oracle的各种性能视图(如V$INDEX_USAGE_INFO)来监控索引的使用情况。这段代码在员工表的部门ID字段上创建了一个B-Tree索引,以优化基于部门ID的查询。即使查询没有包含联合索引的第一列,Oracle也可以通过跳跃扫描来使用这个索引。在这个例子中,如果查询只需要员工的ID和姓名,那么这个索引就可以作为覆盖索引。这个函数索引允许数据库直接使用索引来加速基于入职年份的查询。

2025-06-11 09:31:32 440

原创 左右SQL执行计划妙招 ①——子查询的应用范围

正读懂执行计划,这个其实并不容易。在优化的大方向基本上都清晰后,剩下的就是具体的优化实施:修改数据库及主机相关性能参数;根据业务规则修改SQL代码;重新收集统计信息获取更准确的执行计划等。OK,让我们开始吧,先看看总体学习思路,如下图所示:关键词执行计划 HINT 子查询 SQL1 控制执行计划的方法综述1.1 控制执行计划的意义前面已经讲过了,这里简单总结为两点:可以临时在高峰期解决问题,避免因收集统计信息带来的开销;有BUG导致执行计划一直不对,只好用人工控制来处理。

2025-06-11 09:27:10 593

原创 oracle与MySQL数据库之间数据同步的技术要点

日志分析工具:例如使用 Oracle GoldenGate(Oracle的实时数据复制工具)或 Maxwell、 Debezium等工具,它们通过分析数据库日志来捕获数据变更并同步到目标数据库。不同的业务场景和需求可能会采用不同的同步技术和方案,选择合适的工具和策略,能够实现高效、稳定的数据同步。例如,如果Oracle数据库是主数据库,则Oracle的更新会覆盖MySQL中的冲突数据。SymmetricDS:一个开源的跨平台数据同步工具,支持不同数据库之间的数据同步,包括Oracle和MySQL。

2025-06-10 09:23:03 349

原创 实时流数据的核心概念与应用场景解析

处理后的数据存入实时数仓(如 StarRocks、ClickHouse)或数据湖(如 Apache Hudi、Iceberg),支撑 BI 报表、实时大屏、风控等场景。在当今数字经济时代,实时流数据正成为企业核心竞争力。例如,在实际应用中, 芒果 TV 的实时业务数据通过 Kafka 分发至下游处理系统,而腾讯大数据则依赖 Kafka 构建湖仓一体化的数据管道。与传统批处理模式相比,实时流数据处理能够在数据产生的同时进行分析和响应,将数据价值的实现时间从“小时/天级”压缩至“秒/毫秒级”。

2025-06-10 09:17:34 431

原创 数据湖和数据仓库的区别

通过构建混合架构、统一的数据服务平台和智能数据管理,企业能够跨越传统数据管理的限制,构建起既能够快速适应市场变化,又能深入挖掘数据价值的现代化数据生态系统。在这个过程中,持续的数据治理、智能化技术的应用,以及对用户需求的深刻理解,将是推动数据湖与数据仓库融合发展的关键因素。然而,随着企业的增长和数据需求的变化,建立一个简化版的数据湖或采用云服务提供的数据湖解决方案可能是有益的。数据仓库是一种用于数据存储和管理的系统,其定义为一个面向主题的、集成的、不可变的、随时间变化的数据集合,用于支持管理决策。

2025-06-09 10:25:52 1071

原创 物化视图(Materialized View)

从本质上讲, 物化视图是将查询结果物理化存储的数据库对象,它通过预先计算并持久化存储复杂查询的结果,从而在后续查询时直接返回预计算的数据,避免了重复的计算过程。小红书在离线数仓中用物化视图替代传统多 Cube 表,物化视图预先计算并存储关联聚合结果,查询时自动路由至已计算数据,无需维护多张宽表或 Cube,显著减少数据处理量并加快查询速度。这一案例展示了 StarRocks 物化视图在构建实时数据仓库中的应用价值,通过多层物化视图设计,实现了实时数据的高效处理和查询,为业务决策提供了强有力的数据支持。

2025-06-09 10:11:25 994

原创 数据集市(Data Mart)的简介

数据集市(Data Mart)是数据仓库(Data Warehouse)的一个子集,专门针对某个特定业务部门、业务线或主题领域,存储和管理该部门或领域所需的特定数据。数据集市就像是“数据仓库中的小仓库”或“部门级的数据仓库”,它是企业数据仓库的一个专门部分,专注于满足特定业务线或部门的需求[例如销售、财务等],使得这些部门能够快速获取和分析相关数据。数据集市是企业数据仓库的一个子集,专门为特定业务部门或主题设计,提供定制化、结构化的数据存储和分析支持。提高数据访问的灵活性和性能。

2025-06-06 10:35:02 291

原创 分析型数据库与事务型数据库介绍,核心差异与选型指南

然而,面对事务型数据库和分析型数据库的选择,许多技术团队往往陷入困境:日常运行良好的系统在数据量激增时性能骤降,简单的查询在复杂分析场景下变得异常缓慢。通过理解事务型数据库和分析型数据库的本质差异,结合业务特点和未来发展规划,您可以为企业构建更高效、更可靠的数据基础设施。QPS(每秒查询数)和查询响应时间: 分析型数据库更关注复杂查询的执行效率和系统的并发查询能力,尤其是在大数据量下的表现。分钟级延迟: 如果业务可以接受分钟级的数据延迟,分析型数据库的批处理模式能够提供更高的吞吐量和更优的资源利用率。

2025-06-06 10:18:26 830

原创 MySQL表设计经验

表设计

2025-06-05 09:28:58 554

原创 Java开发中复用公共SQL的方法

这个问题让我眼前一亮,因为在实际项目中,SQL复用确实是一个非常实用且能提升代码质量的做法。我告诉面试官:“是的,我在开发中经常会复用公共SQL,尤其是在Java后端项目中。最后,我总结道:“在Java后端开发中,复用公共SQL是一个很实用的习惯。这样,如果以后需要调整查询字段(比如新增phone字段),只需要改动定义的地方,所有引用它的查询都会自动更新,省时省力。如果项目中不完全依赖MyBatis,或者有些SQL是直接通过JDBC执行的,我会用Java的常量类来管理公共SQL片段。

2025-06-05 09:22:51 457

原创 Oracle的Hint

Hint生效的范围仅限于它本身所在的查询块,如果在Hint中不指定该Hint生效的查询块,那么Oracle会默认认为它生效的范围是指该Hint所处于的查询块。因为“IS”是一个关键字,“,”(逗号)也是一个关键字,所以,上面的第2和第3条SQL,Oracle解析时,当遇到“,”和“IS”时,就忽略了后面的所有Hint。③ 使用的Hint是自相矛盾的(例如,即指定了FULL又指定了INDEX_FFS),但Oracle只是将自相矛盾的Hint全部忽略掉,而组合Hint中的其它Hint依然有效。

2025-06-02 16:14:02 885

原创 oracle sql 语句 优化方法

oracle解析器对from 后面的表的解析是从右到左的,所以把数据量较小的表作为主表,然后和其他表进行关联,假如存在三个以下表,把同 时交叉关联的表作为主表,提高查询效率。7、优化分组group by ,对group by字段要进行添加锁引,如果分组当中含 有查询条件,要改写为where条件进行过滤后,再进行分组,而不是直接进行 having 条件。例如删除重复记录的时候,可以根据rowid进行删除。10、利用>=替代>,因为>=可以直接定位到=的位置,而大于必须先 定位位置,然后再查询下一个数据。

2025-06-02 15:22:51 831

原创 深入理解分布式锁——以Redis为例

一、分布式锁简介线程锁:也被称为互斥锁(Mutex),主要用于控制同一进程中的多个线程对共享资源的访问。进程锁进程锁是用于控制同一台机器上的多个进程对共享资源的访问。进程锁可以是系统级的,如文件锁,也可以是用户级的,如信号量(Semaphore)。分布式锁分布式锁是用于控制分布式系统中的多个节点对共享资源的访问。由于分布式系统中的节点可能位于不同的机器甚至不同的地理位置,因此分布式锁的实现比线程锁和进程锁要复杂得多。分布式锁需要在网络中的多个节点之间进行协调,以保证锁的唯一性和一致性。

2025-05-29 14:48:35 999

原创 数据可视化的定义和类型

降维:维度越高,数据集在维度空间的分布越稀疏,从而减弱了数据集的密度和距离的定义对数据聚类和离群值检测等操作的影响。特征生成:特征生成是指在原始数据的基础上构建新的能反映数据集重要信息的属性,包括特征抽取、将数据应用到新空间、基于特征融合与特征变换的特征构造。特征子集选择:从数据集中选择部分数据属性值可以消除冗余的特征、与任务无关的特征,包括暴力枚举法、特征重要性选择、压缩感知理论的稀疏表达方法。采样:采样是统计学的基本方法,也是对数据进行选择的主要手段,对数据的初步探索和最后的数据分析环节经常被采用。

2025-05-29 14:47:10 565

原创 实时数仓和离线数仓的区别是什么?企业如何选择合适的数仓架构?

随着业务的发展,随着业务的发展,人们对数据实时性提出了更高的要求。从1990年 Inmon 提出数据仓库概念到今天,数仓架构经历了最初的传统数仓架构、离线大数据架构、Lambda 架构、Kappa 架构以及由Flink 的火热带出的流批一体架构,数据架构技术不断演进,本质是在往流批一体的方向发展,让用户能以最自然、最小的成本完成实时计算。综上所述,数仓建设是企业数据管理和决策支持的关键环节,在实践中,企业需要根据自身业务需求和数据规模,选择合适的数仓建设方案和技术方案,以提高企业数据资产的价值和利用效率。

2025-05-27 09:00:06 900

原创 数据仓库基础知识总结

总的来说,数据中台距离业务更近,数据复用能力更强,能为业务提供速度更快的服务,数据中台在数据仓库和数据平台的基础上,将数据生产为一个个数据API服务,以更高效的方式提供给业务。2)逻辑模型LDM:逻辑模型反映的是系统分析人员对数据存储的观点,是对概念模型的进一步分解和细化,逻辑模型是根据业务规则确定的,关于业务对象,业务对象的数据项以及业务对象之间关系的基本蓝图。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整并且一致的描述,能刻画各个分析对象所涉及的企业各项数据,以及数据之间的联系。

2025-05-27 08:48:52 1195

原创 oracle中对JSON数据处理的详细指南

Oracle中关于JSON的操作函数有JSON_ARRAY、JSON_EXISTS、JSON_VALUES、JSON_TABLE、JSON_QUERY,其中JSON_ARRAY是用来构建JSON数组的,而不是用来查找结果的。你可以在 JSON_ARRAY 中使用不同类型的参数,例如字符串,数字和布尔值,它们都将被转换为相应的 JSON 类型。其中,json_column是指要查询的JSON列,json_path_expression是指JSON路径表达式,用于指定要查找的JSON数据的位置和条件。

2025-05-23 14:28:45 757

原创 Oracle 基础知识作业的使用

Oracle 视图 User_Jobs 是Oracle数据库中的一个视图,包含当前用户拥有的所有系统作业信息,用户可以通过该视图查询用户作业,并获取相关信息,比如作业名称、作业状态、运行状态。对于DBA来说,数据库Job再熟悉不过了,因为经常要数据库定时的自动执行一些脚本,或做数据库备份,或做数据的提炼,或做数据库的性能优化,包括重建索引等等的工作。此时如果直接提交了的话,可能就会马上执行这个job,如果不想让其今天再执行了,可以这样处理,先将这个job remove然后在创建一个新的job。

2025-05-23 13:31:07 1002

原创 7个最常用的数据分析方法和技巧

这种方法不仅能将庞杂的数据集压缩为更易处理的维度,还能揭示数据底层隐藏的规律,尤其适用于量化抽象概念——例如财富水平、幸福感,或商业场景中的客户忠诚度、满意度等难以直接测量的指标。蒙特卡洛模拟的实施通常以数学模型为基础,模型中包含一个或多个目标输出变量(如利润、销售额),以及可能影响输出的输入变量(如营销预算、员工薪资)。基础型分析,将文本情绪归类为"正向"、“中性"或"负向”。在进行任何类型的回归分析时,你需检验因变量(即需测量或预测的结果变量)与若干自变量(可能影响因变量的因素)之间是否存在相关性。

2025-05-21 10:31:02 700

原创 数据库大表归档需要注意以下几点

是不是觉得这样切一下 就实现了历史数据归档,相比delete 数据,有明显的优势,速度快,归档产生少,迁移用时少,需要的停机窗口短。看似简单的归档迁移,如果是使用ctas+rename来实现,在时间上确实会比delete+shrink要快很多,停机窗口也会比较短,目前是用户有几个大的log表需要做归档,最大的一个表大概4亿笔数据,打算只保留最近180天的数据,其他的历史数据迁移至归档库。一个数据库的大表归档,因为大意遇到了几个坑,这里记录一下,给后续有类似操作的朋友,提供一个参考。

2025-05-21 10:10:34 546

原创 Oracle资源管理器

但这些会话必定有轻重缓急之分,对于重要且紧急的用户会话需求理当获得多一点的系统资源,对于一些不重要或不紧急的用户会话,则可以使用较少的系统资源慢慢处理。这样可以消除占用过多系统资源的任何异常大的作业。(2)资源计划指令(Resource Plan Directive):是使用资源的条件,如分配给某个特定的资源使用者组,使其在某个特定的时段可使用80%的CPU,或是限制某个使用者组活动会话的数量等,而资源指令只是被包含在资源计划中,资源计划和指令间有着一对多的关系,在资源计划中不能包含两条相同的指令。

2025-05-20 13:55:50 1206

原创 DeepSeek基础:模型蒸馏概念与技术详解

三、核心技术原理1. 原理概述传统的机器学习模型通常是通过"硬标签"(one-hot编码)进行训练,例如图像分类中,一张猫的图片对应标签[1,0,0],表示"是猫,不是狗,不是鸟"。教师模型输出的不仅仅是最终的分类结果,还包含了各个类别的概率分布,例如[0.8, 0.15, 0.05],表示"80%可能是猫,15%可能是狗,5%可能是鸟"。随着一系列复杂模型(如GPT-4、ResNet、BERT)在图像识别、自然语言处理等领域展现了惊人的能力,其庞大的参数量和高昂的计算成本,却成为实际落地的“拦路虎”。

2025-05-20 11:40:51 827

原创 数据分析—Excel数据清洗函数

在做数据清洗时,经常需要去除数据两端的空格,那么TRIM、LTRIM、RTRIM这3个函数就可以帮到你啦~TRIM函数:主要是用来去除单元格内容前后的空格,但不会去除字符之间的空格。SUBSTITUTE函数主要输入被替换的子串和指定的子串就可以将文本里的被替换子串全部替换掉。表达式:=REPLACE(文本, 被替代子串的起始位置, 被替代子串长度, 指定的替代文本)表达式:=SUBSTITUTE(文本, 被替换的子串, 指定的子串)表达式:=MID(文本, 提取子串的起始位置, 提取的子串长度)

2025-05-19 10:42:53 441

原创 使用excel 工具做数据清洗

简单来说就是把数据中「脏脏的 」部分 —— 缺失的、重复的、错误的等等,给它清除掉,剩下「干净的」数据。简单来说就是把数据中「脏脏的 」部分 —— 缺失的、重复的、错误的等等,给它清除掉,剩下「干净的」数据。简单来说就是把数据中「脏脏的 」部分 —— 缺失的、重复的、错误的等等,给它清除掉,剩下「干净的」数据。「比如 2002 年「产品 C」的产量缺失了,那就偷偷把 2002 年从统计表里删掉,只分析后面的~」!所以,如果数据很多、空缺也多,删除过多条目会使得结果产生较大偏差时,我们还是得把空缺补上。

2025-05-19 10:23:25 892

原创 oracle 资源管理器的使用

(2)资源计划指令(Resource Plan Directive):是使用资源的条件,如分配给某个特定的资源使用者组,使其在某个特定的时段可使用80%的CPU,或是限制某个使用者组活动会话的数量等,而资源指令只是被包含在资源计划中,资源计划和指令间有着一对多的关系,在资源计划中不能包含两条相同的指令。如果以某个用户登录的 session,它的用户名是属于多个组的,数据库管理员可以手动的切换这个 session 所属的组。对于没有明确指定计划指令的所有级别,其所有子计划或使用者组的默认资源是0%。

2025-05-18 11:03:14 851

原创 Oracle 内存优化

拿SGA中两个最重要的内存区Buffer Cache和Shared Pool来说,它们两个对实例的性能影响最大,但是就有这样的矛盾存在:在内存资源有限的情况下,某些时候数据被cache的需求非常大,了提高buffer hit,就需要增加Buffer Cache大小。当实例启动后,各个内存区只分配实例所需要的最小大小,在随后的运行过程中,再根据需要扩展他们的大小,而他们的总和大小受到了SGA_MAX_SIZE的限制。此外,一旦分配后,各个区的内存只能给本区使用,相互之间是不能共享的。

2025-05-18 10:58:21 1122

原创 数据分析基础:需要掌握的入门知识

数据分析是一项令人着迷的技能,它不仅仅关乎处理数字,更是将复杂的数据转化为有意义的洞察,推动决策并创造价值。在一次项目中,我使用统计方法分析了一个电商平台的用户数据,发现了用户行为模式中的关键趋势,这直接影响了公司后续的营销策略。我曾在一个项目中,尽管数据分析得出了很好的结论,但由于未能用业务语言有效沟通,导致了团队的误解和项目的延误。在我的职业生涯中,这些技能帮助我在复杂的商业环境中做出了有影响力的决策,也让我不断成长,获得了巨大的职业满足感。数据是分析的基础,没有高质量的数据,就没有可靠的分析结果。

2025-05-11 13:36:48 546 1

原创 oracle大数据常用函数

可以清晰的看到id为10的name列的值是从ab依次叠加到最后ab,bc,cd(当然这几个值肯定是id为10对应的值),id为20的name列的值是从ab,bc,cd,hi(之所以不是从ab开始是因为当前order by的。上边的查询语句返回的结果可以清晰看到rank存在重复的,一个相同的rank对应多个Name,如果我们想把某一个Rank的所有Name以","隔开,怎么做的,当然可以自定义函数,ver函数: over函数指定了分析函数工作的数据窗口的大小,这个数据窗口大小可能会随着行的变化而变化。

2025-05-11 09:39:36 742

原创 oracle 会话管理

KILLED :处于此状态的会话,表示出现了错误或进程被杀掉,正在回滚,当然,这个状态的会话也占用系统资源的。还有一点就是, KILLED的状态一般会持续较长时间,如果你想快速杀掉回话,可以参考我以前的一篇文章ORACLE快速彻底Kill掉的会话。会话有ACTIVE、INACTIVE、KILLED、CACHED、SNIPED五个状态,一般比较常见的有ACTIVE、INACTIVE、KILLED三个状态。INACTIVE :处于此状态的会话表示不是正在执行的。3:查看当前窗口/当前用户的会话信息。

2025-05-11 09:37:30 905

原创 把Excel数据文件导入到Oracle数据库

数据管理和分析的领域,将Excel中的数据导入到Oracle数据库是一个常见的需求,无论是为了利用Oracle强大的数据处理能力,还是为了实现数据的集中存储和管理,这一过程都需要一定的步骤和技巧,本文将详细介绍如何从Excel导入数据到Oracle数据库,包括准备工作、导入方法以及注意事项等。2、了解数据结构:在开始导入之前,仔细检查Excel文件中的数据结构和内容,确保它们符合Oracle数据库表的结构要求,这包括列名、数据类型、约束条件等,如果有必要,可以在Excel中进行数据清洗和预处理。

2025-05-09 11:16:55 1014

原创 数据库审计如何维护数据完整性:7 种工具和技术

DataNumen 是一家数据恢复技术公司,我们实施了一套自动化数据库审计系统,该系统将 SQL Server 的 DBCC CHECKDB 与我们的 DataNumen SQL 恢复软件集成在一起。这种技术涉及创建数据的唯一数字指纹,并可随着时间的推移对其进行比较,以检测任何未经授权的更改。最终,一个强大、可扩展的审计框架增强了数据完整性保证,支持合规性,并在法律、安全和工程团队之间建立了信任,而所有这一切都不会影响性能或增加核心系统的运行开销。区块链的透明性还允许授权方轻松验证数据的完整性。

2025-05-09 10:53:23 609

原创 查询数据库速度慢常用语句

INSERT阻塞主要是由于有一个带主键的表,或者表上有惟一的约束,在两个会话试图用同样的值插入一行数据时引发阻塞。阻塞的定义:一个会话持有某个资源的锁,而另一个会话在请求这个资源,就会出现阻塞。大多数情况下,在一个交互式应用中被严重阻塞,即可表明应用逻辑有问题,这才是阻塞的根源。阻塞是DBA经常碰到的情形,尤其是不良的应用程序设计的阻塞将导致性能严重下降直至数据库崩溃。对DBA而言,有必要知道如何定位到当前系统有哪些阻塞,到底谁是阻塞者,谁是被阻塞者。【例14-7】查询SQL语句执行的耗时的语句。

2025-05-08 13:41:56 288

原创 闪回查询和闪回表

因此要注意undo 表空间的大小,保证其有足够的存储空间。需要注意是undo_retention 只是指定undo 数据的过期时间,并不是undo 中的数据一定会在undo表空间中保存15 分钟,比如一个新事务刚开始的时候,如果undo 表空间已经被写满,则新事务的数据会自动覆盖已提交事务的数据,而不管这些数据是否已过期。闪回归档概念:无限期的存储表行的前镜像,通过后台进程 FBDA,捕捉必要的数据并将其保存在归档上,然后可以使用常规闪回查询命令(as of)查询需要的数据,闪回可以回朔到多年以前。

2025-05-08 13:40:10 1587

原创 oracle 优化器

CBO在选择执行计划的时候,所用的判断原则为成本,CBO会从诸多的执行计划中选择一条成本最小的执行路径作为其执行计划。当SQL执行的时候,有不同的执行路径可以选择,那么就从该SQL的执行计划中选择一条等级值最低的路径作为其执行计划。CBO假设所有SQL都是单独执行,互不干扰的,但很多时候,执行目标SQL需要的数据块、索引叶子块等数据可能已经被缓存到了Buffer Cache中了,单独计算可能也会导致选择不到最优的执行计划。指的是加上WHERE条件后返回的结果集的数量与不加条件返回的原始结果集的记录数比值。

2025-05-07 13:13:29 829

原创 oracle 数据库sql 语句处理过程

当执行一个SQL语句(有时被称为一个游标)时,如果它和之前的执行过的语句完全相同,Oracle就能很快获得已经被解析的语句以及最好的执行路径。Oracle只对每个SQL语句翻译一次,在以后再次执行该语句时,只要该语句还在共享SQL区中,就可以避免对该语句重新进行语法分析,也就是此时可以直接使用其对应的执行计划对数据进行存取。要使用内存中共享池的SQL,必须满足以下条件:当前被执行的语句和共享池中的语句必须完全相同 (包括大小写、空格、换行等),两个语句所指的对象必须完全相同 (同义词与表是不同的对象);

2025-05-07 13:09:17 392

原创 Oracle数据库闪回技术

从管理的角度为每个用户“分配”一个回收站,但这个回收站并不实际开辟空间(只是个逻辑容器),当 drop table 时(非 purge),原来的表所使用的段中的数据并没有真正的删除。从图13-14可以看出,TEST 表空间中的空闲空间又回来了,这说明如果 test 表空间不够时,使用了回收站的空间。这部分空闲空间是可以被重新利用的,实际上即使你设置了表空间 autoextend 特性,Oracle 会先使用回收站,若空间还不够,再考虑 autoextend。删除该表后再闪回表,查看索引和约束是否存在。

2025-04-29 09:39:20 738

原创 使用rman工具备份及恢复

第一个全备是 5 天前生成的,第二个全备是十天前生成的,而最早一个全备是 15 天前备份 的,那么十天前生成的备份及之后的归档日志必须保留,而 15 天前的那个备份会成为废弃备份(obsolete)。如果取消 ALLOCATE CHANNEL 语句,则通道数按全局变量 PARALLELISM 指定,假定为 1,那 20 个文件,FILESPERSET=8 该是怎样的结果:一个通道干活,8 个文件组成一个备份集,每备份集对一个备份片,完成一个备份集再接下一个备份集。只备份自某次备份以来发生变化的数据块。

2025-04-29 09:25:03 839

MySQL数据库基础教程.

mysql 基础知识 MySQL安装 基本数据类型

2015-12-01

数据库 教程

oracle 数据库基础 数据库的管理员应该掌握的

2015-12-01

某银行的数据库项目, 数据挖掘/数仓项目 后端jjava ,oracle 数据库

数据挖掘/数仓项目 包括技术架构(数据分层设计),逻辑架构,开发流程、数据字典 由于银行数据比较分散,需要建立一个以客户个人为基本单位的客户全景视图的数据

2024-05-17

oracle 数据库sql 语句面试题,北京一家软件公司的面试题,难度中等

数据库面试题

2024-05-17

mysql 面试题 其中有答案

mysql 面试题包括答案,问题难度中等

2023-11-19

Eclipse中连接数据库的详细步骤

Eclipse中连接数据库

2023-11-02

eclipse连接数据库的详细步骤

eclipse怎么连接数据库

2023-11-02

oracle 数据库从入门到 开发课程

包括教学笔记 加习题

2022-07-18

数据挖掘和大数据处理经验笔记

1.学习数据挖掘的整体流程及相关的数据库编程技能 2.理解数据清洗,数据整合,数据建模的概念 3. 学习处理海量数据包括如何建表,如何快速查询,插入数据。

2020-09-30

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除