文章原文
链接: 原文:来源Java中文社群.
准备
正式开始之前,我们先来看下 MySQL 服务器的配置和版本号信息,如下图所示:
插入基础数据
-- 如果存在 person 表先删除
DROP TABLE IF EXISTS person;
-- 创建 person 表,其中 username 字段可为空,并为其设置普通索引
CREATE TABLE person (
id INT PRIMARY KEY auto_increment,
name VARCHAR(20),
mobile VARCHAR(13),
index(name)
) ENGINE='innodb';
-- person 表添加测试数据
insert into person(name,mobile) values('Java','13333333330'),
('MySQL','13333333331'),
('Redis','13333333332'),
('Kafka','13333333333'),
('Spring','13333333334'),
('MyBatis','13333333335'),
('RabbitMQ','13333333336'),
('Golang','13333333337'),
(NULL,'13333333338'),
(NULL,'13333333339');
select * from person;
构建的数据如下
之后对数据进行查看,当列中存在Null时会出现的问题.
1. count数丢失
当某列存在Null值时,再使用count查询该列时,就会出现数据“丢失”的问题,如下
select count(*),count(name) from person;
执行结果如下
从上述结果中,可以看出,当使用的时count(name),查询时,就丢失了两条值为null的数据。
解决方案
如果某列存在null值时,就用==count(*)==进行数据统计。
扩展知识:不要使用count(常量)
阿里巴巴《Java开发手册》规定,不要使用count(列名)或count(常量)来替代count(),count()时SQL92定义的标准统计行数的语法,跟数据库无关,跟null和null无关。
说明: count(*)会统计值为null的行,而count(列名)不会统计列为null的行。
2.distinct数据丢失
当使用==count(distinct col1,col2)==查询时,如果其中一列为 null,那么即使另一列有不同的值,查询的结果也会导致数据丢失,如下所示
select count(distinct name,mobile) from person;
查询结果如下:
数据库原始数据如下:
从上述结果可以看出手机号一列的10条数据都是不同的,但查询的结果却时B。
3.select数据丢失
如果某列存在null时,如果执行非等于查询(<>/!=)会导致null值的结果丢失,比如以下数据:
我需要查询除name等于‘Java’以外的所有数据,预期返回的结果是id从2到10的数据,但执行以下查询时:
select * from person where name<>'Java' order by id;
-- 或
select * from person where name!='Java' order by id;
会查询出以下结果:
可以看出null值的两条数据消失了。
解决方案
要解决以上的问题,只需要在查询结果中品加上为null值的结果即可,执行SQL如下:
select * from person where name<>'Java' or isnull(name) order by id;
结果如下:
4.导致空指针异常
如果某列存在null值时,可能会导致sum(column)的返回结果为null而非0,如果sum查询的结果为null就可能会导致程序执行时空指针异常(NPE)。
首先构建一些数据
-- 如果存在 goods 表先删除
DROP TABLE IF EXISTS goods;
-- 创建 goods 表
CREATE TABLE goods (
id INT PRIMARY KEY auto_increment,
num int
) ENGINE='innodb';
-- goods 表添加测试数据
insert into goods(num) values(3),(6),(6),(NULL);
select * from goods;
表中原始数据如下:
接下来使用sum查询,执行一下SQL
select sum(num) from goods where id>4;
查询执行的结果如下:
当查询的结果为null而非0时,就能导致空指针异常
解决方法
可以使用一下方法来避免空指针异常
select ifnull(sum(num), 0) from goods where id>4;
查询结果如下:
5.增加查询难度
当某列中有null值时,在进行null值或者非null值的查询难度就增加了。
所谓的查询难度增加指的是当进行null值查询时,必须使用null值匹配的查询方法,比如IS NULL 或者 IS NOT NULL,又或者是==IFNULL(column)==这样的表达式进行查询,而传统的 =,!=,<>…,等这些表达式就不能使用了,这就增加了查询难度。
以person表为例,它的原始数据如下:
错误用法1:
select * from person where name<>null;
执行结果为空,并没有查到任何数据,如下图所示:
错误用法2:
select * from person where name!=null;
执行结果也为空,没有查询到任何数据,如图所示:
正确用法1:
select * from person where name is not null;
执行结果如下:
正确用法2 :
select * from person where !isnull(name);
推荐用法:
阿里巴巴《Java开发手册》推荐我们使用ISNULL(column)来判断null值,原因是在SQL语句中,如果在null前换行,影响可读性;而 ==ISNULL(column)==是一个整体,简洁易懂,而从性能上讲 ISNULL(column) 执行效率也更快一些。
扩展知识:null不会影响索引
细心的朋友可能发现了,我在创建 person 表的 name 字段时,为其创建了一个普通索引,如下图所示:
然后我们用explain来分析查询计划,看当name中有null时是否会影响索引的选择。
explain的执行结果如下:
从上图可以看出,即使name中有null值也不会影响MySQL使用索引进行查询。
总结
本文我们讲了当某列为null时可能会导致的5种问题:丢失查询结果,导致空指针异常和增加查询难度,因此在最后提倡大家创建表时进行设置IS NOT NULL约束,如果某列确实没有值,可以设置空值(“”)或0作为其默认值。