三大主流数据对比＆＆数据库的优化思路

最新推荐文章于 2021-01-30 16:21:32 发布

乖乖猪001

最新推荐文章于 2021-01-30 16:21:32 发布

阅读量416

点赞数

分类专栏：大数据文章标签：数据库

本文链接：https://blog.csdn.net/xiaozhaoshigedasb/article/details/85418650

版权

大数据专栏收录该内容

73 篇文章 11 订阅

订阅专栏

SQL书写规范
1.大小写分明，提高你的表达。别人一看你写下来的sql语句就能识别你的词义。
2.缩进。提高你的逻辑层次表达能力。
3.语句区分一下，比如等号两边用一下空格。
4.换行。两个步骤之间的语句要换一下行。
5.注释。字段不必要写注释，可以在你的整个语句段落加一句注释。

Oracle

Oracle 能在所有主流平台上运行（包括Windows）。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。对开发商全力支持，Oracle并行服务器通过使一组结点共享同一簇中的工作来扩展Windows NT的能力，提供高可用性和高伸缩性的簇的解决方案。如果Windows NT不能满足需要，用户可以把数据库移到UNIX中。Oracle的并行服务器对各种UNIX平台的集群机制都有着相当高的集成度。Oracle获得最高认证级别的ISO标准认证.Oracle性能最高，保持开放平台下的TPC-D和TPC-C的世界记录Oracle多层次网络计算，支持多种工业标准，可以用ODBC、JDBC、OCI等网络客户连接。
Oracle 在兼容性、可移植性、可联结性、高生产率上、开放性也存在优点。Oracle产品采用标准SQL，并经过美国国家标准技术所（NIST）测试。与 IBM SQL/DS，DB2，INGRES，IDMS/R等兼容。　Oracle的产品可运行于很宽范围的硬件与操作系统平台上。可以安装在70种以上不同的大、中、小型机上；可在VMS、DOS、UNIX、WINDOWS等多种操作系统下工作。能与多种通讯网络相连，支持各种协议（TCP/IP、 DECnet、LU6.2等）。提供了多种开发工具，能极大的方便用户进行进一步的开发。Oracle良好的兼容性、可移植性、可连接性和高生产率是 Oracle RDBMS具有良好的开放性。
Oracle价格是比较昂贵的。据说一套正版的Oracle软件早在2006年年底的时候在市场上的价格已经达到了6位数。所以如果你的项目不是那种超级大的项目，还是放弃Oracle吧。

SQL Server

SQL Server 是 Microsoft推出一套产品，它具有使用方便、可伸缩性好、与相关软件集成程度高等优点，逐渐成为Windows平台下进行数据库应用开发较为理想的选择之一。SQLServer是目前流行的数据库之一，它已广泛应用于金融、保险、电力、行政管理等与数据库有关的行业。而且，由于其易操作性及友好的界面,赢得了广大用户的青睐,尤其是SQLServer与其它数据库,如Access、FoxPro、Excel等有良好的ODBC接口，可以把上述数据库转成SQLServer的数据库,因此目前越来越多的读者正在使用SQLServer。
SQL Server由于是微软的产品，又有着如此强大的功能，所以他的影响力是几种数据库系统中比较大，用户也是比较多的。它一般是和同是微软产品的.net平台一起搭配使用。当然其他的各种开发平台，都提供了与它相关的数据库连接方式。因此，开发软件用SQL Server做数据库是一个正确的选择。

MySQL

MySQL不支持事务处理，没有视图，没有存储过程和触发器，没有数据库端的用户自定义函数，不能完全使用标准的SQL语法。
从数据库行家听说的第一件事就是MySQL缺乏transactions，rollbacks，和subselects的功能。如果你计划使用MySQL写一个关于银行、会计的应用程序，或者计划维护一些随时需要线性递增的不同类的计数器，你将缺乏transactions功能。在现有的发布版本的 MySQL下，请不要有任何的这些想法。（请注意，MySQL的测试版3.23.x系列现在已经支持transactions了）。
　　在非常必要的情况下，MySQL的局限性可以通过一部分开发者的努力得到克服。在MySQL中你失去的主要功能是subselect语句，而这正是其它的所有数据库都具有的。换而言之，这个失去的功能是一个痛苦。
MySQL没法处理复杂的关联性数据库功能，例如，子查询（subqueries），虽然大多数的子查询都可以改写成join
另一个MySQL没有提供支持的功能是事务处理（transaction）以及事务的提交（commit）/撤销（rollback）。一个事务指的是被当作一个单位来共同执行的一群或一套命令。如果一个事务没法完成，那么整个事务里面没有一个指令是真正执行下去的。对于必须处理线上订单的商业网站来说，MySQL没有支持这项功能，的确让人觉得很失望。但是可以用MaxSQL，一个分开的服务器，它能通过外挂的表格来支持事务功能。　
外键（foreignkey）以及参考完整性限制（referentialintegrity）可以让你制定表格中资料间的约束，然后将约束（constraint）加到你所规定的资料里面。这些MySQL没有的功能表示一个有赖复杂的资料关系的应用程序并不适合使用MySQL。当我们说 MySQL不支持外键时，我们指的就是数据库的参考完整性限制–MySQL并没有支持外键的规则，当然更没有支持连锁删除（cascadingdelete）的功能。简短的说，如果你的工作需要使用复杂的资料关联，那你还是用原来的Access吧。　
你在MySQL中也不会找到存储进程（storedprocedure）以及触发器（trigger）。（针对这些功能，在Access提供了相对的事件进程（eventprocedure）。
MySQL+php+apache三者被软件开发者称为“php黄金组合”。
Oracle和MySQL的主要区别
Oracle:客户端和命令窗口，都是由用户决定内容-> conn user_name/password;
MySQL:客户端和命令窗口，都是由数据库决定内容-> use datebase;
都可以创建多数据库多用户，个人倾向于Oracle一个数据库中多个用户的形式，MySQL多个数据库多个用户形式（最好每个数据库对应一个用户）
Oracle是大型数据库而MySQL是中小型数据库，Oracle市场占有率达40%，MySQL只有20%左右，同时MySQL是开源的而Oracle价格非常高。
Oracle支持大并发，大访问量，是OLTP（On-Line Transaction Processing联机事务处理系统）最好的工具。
安装所用的空间差别也是很大的，MySQL安装完后才152M而Oracle有3G左右，且使用的时候Oracle占用特别大的内存空间和其他机器性能。
Oracle也与MySQL操作上的一些区别
组函数用法规则
MySQL中组函数在select语句中可以随意使用，但在Oracle中如果查询语句中有组函数，那其他列名必须是组函数处理过的，或者是group by子句中的列否则报错
eg：
select name,count(money) from user；这个放在MySQL中没有问题在Oracle中就有问题了。
自动增长的数据类型处理
MySQL有自动增长的数据类型，插入记录时不用操作此字段，会自动获得数据值。Oracle没有自动增长的数据类型，需要建立一个自动增长的序列号，插入记录时要把序列号的下一个值赋于此字段。
CREATE SEQUENCE序列号的名称(最好是表名+序列号标记)INCREMENT BY 1 START WITH 1 MAXVALUE 99999 CYCLE NOCACHE;
其中最大的值按字段的长度来定，如果定义的自动增长的序列号NUMBER(6)，最大值为999999
INSERT语句插入这个字段值为：序列号的名称.NEXTVAL
单引号的处理
MySQL里可以用双引号包起字符串，Oracle里只可以用单引号包起字符串。在插入和修改字符串前必须做单引号的替换：把所有出现的一个单引号替换成两个单引号。
翻页的SQL语句的处理
MySQL处理翻页的SQL语句比较简单，用LIMIT开始位置，记录个数；PHP里还可以用SEEK定位到结果集的位置。Oracle处理翻页的SQL语句就比较繁琐了。每个结果集只有一个ROWNUM字段标明它的位置，并且只能用ROWNUM<100，不能用ROWNUM>80。
以下是经过分析后较好的两种Oracle翻页SQL语句(ID是唯一关键字的字段名)：
语句一：
SELECT ID, [FIELD_NAME,…] FROM TABLE_NAME WHERE ID IN ( SELECT ID FROM (SELECT ROWNUM AS NUMROW, ID FROM TABLE_NAME WHERE 条件1 ORDER BY 条件2) WHERE NUMROW > 80 AND NUMROW < 100 ) ORDER BY 条件3;
语句二：
SELECT * FROM (( SELECT ROWNUM AS NUMROW, c.* from (SELECT [FIELD_NAME,…] FROM TABLE_NAME WHERE 条件1 ORDER BY 条件2) c) WHERE NUMROW > 80 AND NUMROW < 100 ) ORDER BY 条件3;
长字符串的处理
长字符串的处理Oracle也有它特殊的地方。INSERT和UPDATE时最大可操作的字符串长度小于等于4000个单字节，如果要插入更长的字符串，请考虑字段用CLOB类型，方法借用Oracle里自带的DBMS_LOB程序包。插入修改记录前一定要做进行非空和长度判断，不能为空的字段值和超出长度字段值都应该提出警告，返回上次操作。
日期字段的处理
MySQL日期字段分DATE和TIME两种，Oracle日期字段只有DATE，包含年月日时分秒信息，用当前数据库的系统时间为SYSDATE，精确到秒，或者用字符串转换成日期型函数TO_DATE(‘2001-08-01’,‘YYYY-MM-DD’)年-月-日24小时:分钟:秒的格式YYYY-MM-DD HH24:MI:SS TO_DATE()还有很多种日期格式，可以参看Oracle DOC.
日期型字段转换成字符串函数TO_CHAR(‘2001-08-01’,‘YYYY-MM-DD HH24:MI:SS’)
日期字段的数学运算公式有很大的不同。MySQL找到离当前时间7天用DATE_FIELD_NAME > SUBDATE(NOW()，INTERVAL 7 DAY)Oracle找到离当前时间7天用 DATE_FIELD_NAME >SYSDATE - 7;
MySQL中插入当前时间的几个函数是：NOW()函数以`'YYYY-MM-DD HH:MM:SS’返回当前的日期时间，可以直接存到DATETIME字段中。CURDATE()以’YYYY-MM-DD’的格式返回今天的日期，可以直接存到DATE字段中。CURTIME()以’HH:MM:SS’的格式返回当前的时间，可以直接存到TIME字段中。例：insert into tablename (fieldname) values (now())
而Oracle中当前时间是sysdate
空字符的处理
MySQL的非空字段也有空的内容，Oracle里定义了非空字段就不容许有空的内容。按MySQL的NOT NULL来定义Oracle表结构，导数据的时候会产生错误。因此导数据时要对空字符进行判断，如果为NULL或空字符，需要把它改成一个空格的字符串。
字符串的模糊比较
MySQL里用字段名like%‘字符串%’，Oracle里也可以用字段名like%'字符串%'但这种方法不能使用索引，速度不快，用字符串比较函数instr(字段名，‘字符串’)>0会得到更精确的查找结果。
程序和函数里，操作数据库的工作完成后请注意结果集和指针的释放。
主键
MySQL一般使用自动增长类型，在创建表时只要指定表的主键为auto increment,插入记录时，不需要再指定该记录的主键值，MySQL将自动增长；Oracle没有自动增长类型，主键一般使用的序列，插入记录时将序列号的下一个值付给该字段即可；只是ORM框架是只要是native主键生成策略即可。
Oracle实现了ANSIISQL中大部分功能，如，事务的隔离级别、传播特性等而MySQL在这方面还是比较的弱
SQL Server性能优化

一、数据库设计优化
1、不要使用游标。
使用游标不仅占用内存，而且还用不可思议的方式锁定表，它们可以使DBA所能做的一切性能优化等于没做。游标里每执行一次fetch就等于执行一次select。
2、创建适当的索引
每当为一个表添加一个索引，select会更快，可insert和delete却大大变慢，因为创建了维护索引需要许多额外的工作。
（1）采用函数处理的字段不能利用索引
（2）条件内包括了多个本表的字段运算时不能进行索引
3、使用事务
对于一些耗时的操作，使用事务可以达到很好的优化效果。
4、小心死锁
按照一定的次序来访问你的表。如果你先锁住表A，再锁住表B，那么在所有的存储过程中都要按照这个顺序来锁定它们。如果某个存储过程先锁定表B，再锁定表A，这可能会导致一个死锁。
5、不要打开大的数据集
6、不要使用服务器端游标
与服务器端游标比起来，客户端游标可以减少服务器和网络的系统开销，并且还减少锁定时间。
7、不要忽略同时修改同一记录的问题
有时候，两个用户会同时修改同一记录，这样，后一个修改者修改了前一个修改者的操作，某些更新就会丢失。处理这种情况，创建一个timestamp字段，在写入前检查它，如果允许，就合并修改，如果存在冲突，提示用户。
8、尽量不要使用text数据类型
除非使用text处理一个很大的数据，否则不要使用它。因为它不易于查询，速度慢，用的不好还会浪费大量的空间。一般varchar可以更好的处理数据。
9、避免在索引列上使用计算
where子句中，如果索引列是函数的一部分，优化器将不使用索引而使用全表扫描。例如：
（低效）select … from [dept] where [sal]12>25000;
（高效）select … from [dept] where [sal]>25000/12;
10、不同类型的索引效能是不一样的，应尽可能先使用效能高的
数字类型的索引查找效率高于字符串类型，定长字符串char、nchar的索引效率高于变长字符串varchar、nvarchar的索引。
（低效）select … from tableName where username=‘张三’ and age>=21
（高效）select … from tableName where age>=21 and username=‘张三’
二、SQL语句优化
1、不要使用select *
在select中指定所需要的列，将带来的好处：
（1）减少内存耗费和网络的带宽
（2）更安全
（3）给查询优化器机会从索引读取所有需要的列
2、使用参数查询
主要是防止SQL注入，提高安全性。
3、使用exists或not exists代替in或not in
（高效）select * from [emp] where [empno]>0 and exists (select ‘X’ from [dept] where [dept].[deptno]=[emp].[deptno] and [loc]=‘MELB’);
（低效）select * from [emp] where [empno]>0 and [deptno] in (select [deptno] from [dept] where [loc]=‘MELB’);
4、is null或is not null操作
判断字段是否为空一般是不会应用索引的，因为索引不索引空值。不能用null作索引，任何包含null值的列都将不会被包含在索引中。也就是说如果某列存在空值，即使对该列建索引也不会提高性能。任何在where子句中使用is null或is not null的语句优化器都不允许使用索引。
推荐方案：用其他相同功能的操作运算代替，如：a is not null改为a>0或a>’'等。
5、<及>操作
大于或小于一般情况不用调整，因为它有索引就会采用索引查找，但有的情况下可以对它进行优化。如一个表有100万记录，那么执行>2与>=3的效果就有很大区别了。
（低效）select * from [emp] where [deptno]>2;
（高效）select * from [emp] where [deptno]>=3;
6、like操作
like操作可以应用通配符查询，里面的通配符组合可能达到几乎是任意的查询，但是如果用不好则会产生性能上的问题，如lide ‘%5400%’ 这种查询不会引用索引，而like ‘X5400%’ 则会引用范围索引。
7、where后面的条件顺序影响
where子句后面的条件顺序对大数据量表的查询会产生直接的影响。如：
select * from zl_yhjbqk where dy_dj=‘1KV以下’ and xh_bz=1;
select * from zl_yhjbqk where dy_dj=1 and dy_dj=‘1KV以下’;
以上两个查询，两个字段都没进行索引，所以执行的时候都是全表扫描，第一条SQL的dy_dj='1KV以下’条件在记录集内比率为99%，而xh_bz=1的比率只为0.5%，在进行第一条SQL的时候99%条记录都进行dy_dj及xh_bz的比较。而在进行第二条SQL的时候0.5%条记录都进行dy_dj及xh_bz的比较，以此可以得出第二条SQL的CPU占用率明显比第一条低。
8、用union替换or（适用于索引列）
通常情况下，用union替换where子句中的or将会起到较好的效果。对索引列使用or将造成全表扫描。注意：这个规则只针对多个索引列有效。如果有column没有被索引，查询效率可能会因为你没有选择or而降低。下面的例子中loc_id和region上都有建索引。
（低效）select loc_id,loc_desc,begion from location where loc_id=10 or begion=‘MELBOURNE’;
（高效）select loc_id,loc_desc,begion from location where loc_id=10
union
select loc_id,loc_desc_begion from location where begion=‘MELBOURNE’;
9、优化group by
提高group by语句的效率，可以通过将不需要的记录在group by之前过滤掉。
（低效）select [job],avg([sal]) from [emp] group by [job] having job=‘PRESIDENT’ or job=‘MANAGER’;
（高效）select [job],avg([sal]) from [emp] where [job]=‘PRESIDENT’ or job=‘MANAGER’ group by [job];
10、使用存储过程
可以考虑使用存储过程封装那些复杂的SQL语句或业务逻辑，这样有几个好处：
（1）存储过程的执行计划可以被缓存在内存中较长的时间，减少了重新编译的时间。
（2）存储过程减少了客户端和服务器的繁复交互。
（3）如果程序发布后需要做某些改变你可以直接修改存储过程而不用修改程序，避免需要重新安装部署程序。
11、用sp_configure 'query governor cost limit’或者SET QUERY_GOVERNOR_COST_LIMIT来限制查询消耗的资源。当评估查询消耗的资源超出限制时，服务器自动取消查询,在查询之前就扼杀掉。SET LOCKTIME设置锁的时间。
12、使用select top或set rowcount来限制操作的行。
13、如果使用了in或or等时发现查询没有走索引，使用显式申明指定索引： SELECT * FROM PersonMember (INDEX = IX_Title) WHERE processid IN (‘男’，‘女’)。
14、如果要插入大的二进制值到Image列，使用存储过程，千万不要用内嵌insert来插入(不知JAVA是否)。因为这样应用程序首先将二进制值转换成字符串(尺寸是它的两倍)，服务器受到字符后又将他转换成二进制值。存储过程就没有这些动作: 方法：Create procedure p_insert as insert into table(Fimage) values (@image), 在前台调用这个存储过程传入二进制参数，这样处理速度明显改善。
15、分析select emp_name form employee where salary>3000 在此语句中若salary是Float类型的，则优化器对其进行优化为Convert(float,3000)，因为3000是个整数，我们应在编程时使用3000.0而不要等运行时让DBMS进行转化。同样字符和整型数据的转换。
三、处理百万级以上数据提高查询速度的方法
1、尽量避免在where子句中使用!=或<>操作符，否则将使引擎放弃使用索引而进行全表扫描。
2、应考虑在where及order by涉及的列上建立索引。
3、尽量避免在where子句中对字段进行null值判断，否则将导致全表扫描。
4、就是避免在where子句中使用or来连接条件，否则将导致全表扫描。
select id from t where num=10 or num=20 改写为
select id from t where num=10
union all
select id from t where num=20
5、尽量避免使用前置百分号。
select id from t where name like ‘%abc%’
6、in 和not in也要慎用，很多时候可以用exists和not exists，否则会导致全表扫描。
7、如果在where子句中使用参数，也会导致全表扫描。
select id from t where num=@num 可以改为强制查询使用索引
select id from t with(index(索引名)) where num=@num
8、尽量避免在where子句中对字段进行表达式操作，否则将导致全表扫描。
select id from t where num/2=100
应改为：
select id from t where num=1002
9、尽量避免在where子句中对字段进行函数操作，否则将导致全表扫描。
select id from t where substring(name,1,3)=‘abc’
应改为：
select id from t where name like ‘abc%’
10、并不是所有索引对查询都有效，SQL根据表中数据来进行查询优化，当索引列有大量数据重复时，SQL查询可能不会去利用索引。
11、索引并不是越多越好，索引提交了select效率，但是降低了insert和update的效率。一个表的索引数最好不要超过6个。
12、尽量使用数字型字段，若只含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销。因为引擎在处理查询和连接时会逐个比较字符串中每个字符，而对于数字型而言只需要比较一次就够了。
13、尽可能使用varchar/nvarchar代替char/nchar，因为首先变长字段存储空间小，可以节省存储空间；其次对于查询来说，在一个相对较小的字段内搜索效率显然要高些。
14、任何地方都不要使用select ，用具体的字段列表代替，不要返回用不到的字段。
15、尽量避免使用游标，因为游标的效率较差，如果游标操作的数据超过1万行，那么就考虑改写。
16、尽量避免大事务操作，提高系统并发能力。
17、利用set rowcount实现高性能的分页。

Declare @ID int Declare @MoveRecords int
–@CurrentPage和@PageSize是传入参数 Set @MoveRecords=@CurrentPage * @PageSize+1
–下面两行实现快速滚动到我们要取的数据的行，并把ID记录下来 Set Rowcount @MoveRecords Select @ID=ID from Table1 Order by ID
Set Rowcount @PageSize Select * From Table1 Where ID>=@ID Order By ID Set Rowcount 0

四、数据库主键选取
常见的数据库主键选取方式有：
●自动增长字段
●Uniqueidentifier
●“COMB（Combine）”类型
1、自动增长字段
优点：
（1）简单、效率高。
缺点：
（1）自增一般使用int型，有数据条数的限制。
（2）在数据库进行数据合并时会比较麻烦。
2、GUID
优点：
（1）安全，保证唯一性。
（2）不会产生自增字段那样数据合并时的问题。
缺点：
（1）它的长度是16字节，占用大量存储空间。
（2）该数据类型毫无规律，要在上面建立索引很耗时，所以效率要比使用自增字段低。

乖乖猪001

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
三大主流数据对比＆＆数据库的优化思路

SQL书写规范1.大小写分明，提高你的表达。别人一看你写下来的sql语句就能识别你的词义。2.缩进。提高你的逻辑层次表达能力。3.语句区分一下，比如等号两边用一下空格。4.换行。两个步骤之间的语句要换一下行。5.注释。字段不必要写注释，可以在你的整个语句段落加一句注释。OracleOracle 能在所有主流平台上运行（包括Windows）。完全支持所有的工业标准。采用完全开放策略。...
复制链接

扫一扫