索引过滤性不好导致SQL异常缓慢

Mar212018

作者：dbdream 发布：2018-03-21 17:23 分类：Oracle, oracle 11g 抢沙发

刚刚监控到一条SQL占用了大量的I/O，SQL如下：

SELECT ORD_ID,
       UNT_PRD_ID,
       ORD_QTY,
       STKO_WH_NO,
       ORD_WH_NO,
       ORD_MDA_CD,
       STOCK_MDA_CD
  from (SELECT ORD_ID,
               UNT_PRD_ID,
               SUM(ORD_QTY) ORD_QTY,
               STKO_WH_NO,
               ORD_WH_NO,
               ORD_MDA_CD,
               STOCK_MDA_CD
          FROM ORD_ORD_DTL_D T
         WHERE ORD_STS_CD = :1
           AND ORD_PTR_CD = '100'
           AND UNT_PRD_ID = :2
           AND ORD_ACP_DTM >= TO_DATE(:3, 'YYYY-MM-DD HH24:MI:SS')
         GROUP BY ORD_ID,
                  UNT_PRD_ID,
                  STKO_WH_NO,
                  STOCK_MDA_CD，ORD_WH_NO,
                  ORD_MDA_CD)
 ORDER BY ORD_ID

这是一张分区表，ORD_ACP_DTM就是date类型的分区字段，看这条SQL的执行计划，并没什么太大的问题。

SQL> explain plan for
  2  SELECT ORD_ID,
  3         UNT_PRD_ID,
  4         ORD_QTY,
  5         STKO_WH_NO,
  6         ORD_WH_NO,
  7         ORD_MDA_CD,
  8         STOCK_MDA_CD
  9    from (SELECT ORD_ID,
 10                 UNT_PRD_ID,
 11                 SUM(ORD_QTY) ORD_QTY,
 12                 STKO_WH_NO,
 13                 ORD_WH_NO,
 14                 ORD_MDA_CD,
 15                 STOCK_MDA_CD
 16            FROM ORD_ORD_DTL_D T
 17           WHERE ORD_STS_CD = :1
 18             AND ORD_PTR_CD = '100'
 19             AND UNT_PRD_ID = :2
 20             AND ORD_ACP_DTM >= TO_DATE(:3, 'YYYY-MM-DD HH24:MI:SS')
 21           GROUP BY ORD_ID,
 22                    UNT_PRD_ID,
 23                    STKO_WH_NO,
 24                    STOCK_MDA_CD，ORD_WH_NO,
 25                    ORD_MDA_CD)
 26   ORDER BY ORD_ID
 27  ;

Explained.

SQL> set lines 200
SQL> select * from table(dbms_xplan.display); 

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------------------------------
Plan hash value: 67455230
------------------------------------------------------------------------------------------------------------
|Id| Operation                           | Name              |Rows|Bytes|Cost (%CPU)|Time    |Pstart| Pstop |
-------------------------------------------------------------------------------------------------------------
| 0| SELECT STATEMENT                    |                   |   4|  224| 3696   (1)|00:00:45|      |       |
| 1|  SORT GROUP BY                      |                   |   4|  224| 3696   (1)|00:00:45|      |       |
| 2|   PARTITION RANGE ITERATOR          |                   |   4|  224| 3695   (1)|00:00:45|  KEY |1048575|
|*3|    TABLE ACCESS BY LOCAL INDEX ROWID|ORD_ORD_DTL_D      |   4|  224| 3695   (1)|00:00:45|  KEY |1048575|
|*4|     INDEX RANGE SCAN                |IX_ORD_ORD_DTL_D_16|1152|     | 3054   (1)|00:00:37|  KEY |1048575|
-------------------------------------------------------------------------------------------------------------
PLAN_TABLE_OUTPUT
-------------------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
   3 - filter("ORD_STS_CD"=:1 AND "ORD_PTR_CD"='100' AND "ORD_ACP_DTM">=TO_DATE(:3,'YYYY-MM-DD HH24:MI:SS'))
   4 - access("UNT_PRD_ID"=:2)
17 rows selected.

这里面使用了IX_ORD_ORD_DTL_D_16这个索引，可是从监控看，这条SQL使用了IX_ORD_ORD_DTL_D_06索引，下面查看一下这两个索引的信息。

SQL> select INDEX_NAME,COLUMN_NAME,COLUMN_POSITION from user_ind_columns where index_name in ('IX_ORD_ORD_DTL_D_16','IX_ORD_ORD_DTL_D_06') order by 1,3;

INDEX_NAME                     COLUMN_NAME                    COLUMN_POSITION
------------------------------ ------------------------------ ---------------
IX_ORD_ORD_DTL_D_06            ORD_ACP_DTM                                  1
IX_ORD_ORD_DTL_D_06            ORD_STS_CD                                   2
IX_ORD_ORD_DTL_D_06            ORD_DTL_STS_CD                               3
IX_ORD_ORD_DTL_D_16            UNT_PRD_ID                                   1
IX_ORD_ORD_DTL_D_16            UNT_SEQ                                      2

SQL> select segment_name,sum(bytes)/1024/1024/1024 from user_segments where segment_name in  ('IX_ORD_ORD_DTL_D_06','IX_ORD_ORD_DTL_D_16') group by segment_name;

SEGMENT_NAME                       SUM(BYTES)/1024/1024/1024
---------------------------------- -------------------------
IX_ORD_ORD_DTL_D_16                3.65283203
IX_ORD_ORD_DTL_D_06                4.8057251

可以看到这两个都是复合索引，还都不小(因为是分区表的LOCAL索引，每个分区上的索引都不大)，因为我对业务还算熟悉，除了时间字段，其他字段基本都是记录标识信息的字段，重复度相当的高，过滤性极差。

SQL> select num_rows from user_tables where table_name='ORD_ORD_DTL_D';

  NUM_ROWS
----------
  72778422

上面的查询可以看到，数据库大概有7千多万的记录，再看下这些索引列的重复度，这里看几个关键的列就可以。

SQL> select COLUMN_NAME,NUM_DISTINCT from user_tab_columns where TABLE_NAME='ORD_ORD_DTL_D' and column_name in  
('ORD_STS_CD','ORD_DTL_STS_CD','UNT_PRD_ID');

COLUMN_NAME                    NUM_DISTINCT
------------------------------ ------------
ORD_STS_CD                               12
ORD_DTL_STS_CD                           19
UNT_PRD_ID                            64300

是不是很坑爹，监控发现这条SQL根据ORD_ACP_DTM和ORD_STS_CD字段的过滤条件，选择了IX_ORD_ORD_DTL_D_06这个包含ORD_ACP_DTM、ORD_STS_CD、ORD_DTL_STS_CD三个字段的复合索引，关键是ORD_STS_CD只有12个不同的值，过滤性极差，而且这个SQL执行频率还很高，好在当我发现的时候，这条SQL已经选择了过滤性相对好一点的IX_ORD_ORD_DTL_D_16索引。造成这种情况的原因可能是SQL的WHERE条件的时间跨度较大或者是ORD_STS_CD字段的值过滤性相对较好导致的。

数据库存在很多垃圾索引，我们之前通过索引监控，数据库业务用户一共1400多的索引，一年多的时候，有800多一次没有用到过，除去这800多的垃圾索引，还有一些像IX_ORD_ORD_DTL_D_06这样被使用过，但是会严重降低SQL性能的不应该存在索引，这些索引都是业务上线的时候，领导要求创建的，我们向上面反映过这些问题，也遇到过这样因为选择错误的索引导致SQL性能严重下降的问题，但领导不同意，我们也不敢去删，我们只能利用11g的新特性将这样的索引设置成不可用状态，这样索引还是会随着数据的变化而维护，需要的时候在设置回来就行，因为索引会随着数据的变化而维护，不但占用磁盘空间，还会影响数据库的性能，索引也是会有热点块的，也是会有竞争的。

本文固定链接: https://www.dbdream.com.cn/2018/03/%e7%b4%a2%e5%bc%95%e8%bf%87%e6%bb%a4%e6%80%a7%e4%b8%8d%e5%a5%bd%e5%af%bc%e8%87%b4sql%e5%bc%82%e5%b8%b8%e7%bc%93%e6%85%a2/ | 信春哥，系统稳，闭眼上线不回滚！

该日志由 dbdream 于2018年03月21日发表在 Oracle, oracle 11g 分类下，你可以发表评论，并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: 索引过滤性不好导致SQL异常缓慢 | 信春哥，系统稳，闭眼上线不回滚！
关键字: dbms_xplan, display, explain

【上一篇】H330RAID卡对RAID5支持不友好导致磁盘IO异常缓慢
【下一篇】如何在超过2TB(12TB)的磁盘上安装Linux系统

索引过滤性不好导致SQL异常缓慢

您可能还会对这些文章感兴趣！

索引过滤性不好导致SQL异常缓慢：等您坐沙发呢！

发表评论

最新日志热评日志随机日志

最活跃的读者

标签云集

分类目录

文章归档

博客统计

用户登录