INDEX
INDEX,索引。索引在数仓中属于高级技能之一,也是很多HR面试的时候喜欢问的点。
索引可以用来对数据进行排序,并以此来加快搜索和排序。
这点和SUBSTITUTEWITHINDEX函数有点像。白茶在之前描述这个函数的时候曾经说过,这个函数属于高阶函数之一,出场率也不是很高,只有特定的场景可以使用。
这点和SQL中的INDEX有点类似,通常可以用来为原本的维度列新增索引列,以方便某些时候对维度的计算,可以将原本的文本信息转化为可参与计算的数值。
而在SQL中,INDEX表现的则更加纯粹。
基础语法
CREATE INDEX 索引名称
ON 表名称 (列名1,列名2...)
--我们可以设定根据一个维度索引,也可以是多个
注意事项
-
INDEX可以加快查询的速度,但是会增加维护的工作。
例如:增删改都需要注意对INDEX的动态更新。 -
INDEX会增大存储空间。
-
有的数据不适合做索引,例如我们国家的省份,数据量级不多。
-
经常作为排序依据的数据,适合做索引。
面试场景:
数据库索引失效了,可能的原因是什么?
答:
有可能是数据变更的时候,未对索引进行维护更新。
使用实例
案例数据:
在白茶本机的数据库中,存在名为“TEST”的数据库,存在名为“产品表”的案例数据。
例子1:
根据商品名称,新增一列INDEX。
CREATE INDEX Product_INDEX
ON 产品表 (商品名称)
结果如下:
例子2:
根据商品名称,新增一列INDEX,要求不允许索引有重复项。
CREATE UNIQUE INDEX Product_DIS_INDEX
ON 产品表 (商品名称)
结果如下:
例子3:
根据商品名称,新增一列INDEX,要求不允许索引有重复项,且需要根据商品名称降序。
CREATE UNIQUE INDEX Product_DESC_INDEX
ON 产品表 (商品名称 DESC)
结果如下:
例子4:
根据商品名称和商品分类,新增一列INDEX,要求不允许索引有重复项。
CREATE UNIQUE INDEX GroupSort
ON 产品表 (商品名称, 商品分类)
结果如下:
这里是白茶,一个PowerBI的初学者。