转

PgSQL · 源码分析 · PG 优化器中的pathkey与索引在排序时的使用

2017年12月12日 16:09:07 weixin_34375233 阅读数 6

原文链接:https://yq.aliyun.com/articles/280990

概要

SQL在PostgreSQL中的处理，是类似于流水线方式的处理，先后由:

词法、语法解析，生成解析树后，将其交给语义解析
语义解析，生成查询树，将其交给Planner
Planner根据查询树，生成执行计划，交给执行器
执行器执行完成后返回结果

数据库优化器在生成执行计划的时候，优化器会考虑是否需要使用索引，而使用了索引之后，则会考虑如何利用索引已经排过序的特点，来优化相关的排序，比如ORDER BY / GROUP BY等。

先来看个索引对ORDER BY起作用的例子:

postgres=# create table t(id int, name text, value int);
CREATE TABLE
postgres=# create index t_value on t(value);
CREATE INDEX
postgres=# explain select * from
postgres-# t order by value;
QUERY PLAN
----------------------------------------------------------------------
Index Scan using t_value on t (cost=0.15..61.55 rows=1160 width=40)
(1 row)
postgres=# explain select * from
t order by name;
QUERY PLAN
------------------------------------------------------------
Sort (cost=80.64..83.54 rows=1160 width=40)
Sort Key: name
-> Seq Scan on t (cost=0.00..21.60 rows=1160 width=40)
(3 rows)

由此可见，通过索引进行查询后，是可以直接利用已经索引的有序需不需要再次进行排序。

本文将介绍优化器如何在已有索引的基础上，优化排序的。

SQL的流水线处理

数据库以流水线的方式处理SQL请求，当一个SQL到来后:

以SQL中SELECT语句的基本表达形式为例:

SELCT $targets FROM $tables_or_sub_queries WHERE $quals GROUP BY $columns ORDER BY $columns LIMIT $num OFFSET $columns;

为了表示一个SELECT的语句，语义解析之前是SelectStmt结构，其中包括targetlist、FROM 子句、WHERE子句、GROUP BY子句等。

在语义解析之后，会引入一个Query结构，该Query结构只表示当前语句中的内容，并不直接包括需要递归的子句，比如子查询(子查询用RangeTblEntry描述，存放在Query->rtable列表中)等。在Query之后，优化器根据其中的内容生成RelOptInfo，作为整个执行计划的入口。

Query 结构如下，此处我们着重关注rtable和jointree:

95 /*
96 * Query -
97 * Parse analysis turns all statements into a Query tree
98 * for further processing by the rewriter and planner.
99 *
100 * Utility statements (i.e. non-optimizable statements) have the
101 * utilityStmt field set, and the rest of the Query is mostly dummy.
102 *
103 * Planning converts a Query tree into a Plan tree headed by a PlannedStmt
104 * node --- the Query structure is not used by the executor.
105 */ 106 typedef struct Query
107 {
108 NodeTag type;
109 110 CmdType commandType; /* select|insert|update|delete|utility */ 111 112 QuerySource querySource; /* where did I come from? */ 113 114 uint32 queryId; /* query identifier (can be set by plugins) */ 115 116 bool canSetTag; /* do I set the command result tag? */ 117 118 Node *utilityStmt; /* non-null if commandType == CMD_UTILITY */ 119 120 int resultRelation; /* rtable index of target relation for
121 * INSERT/UPDATE/DELETE; 0 for SELECT */ 122
...
133 List *cteList; /* WITH list (of CommonTableExpr's) */ 134 135 List *rtable; /* list of range table entries */ 136 FromExpr *jointree; /* table join tree (FROM and WHERE clauses) */ 137 138 List *targetList; /* target list (of TargetEntry) */ 139
...
146 List *groupClause; /* a list of SortGroupClause's */ 147 156 List *sortClause; /* a list of SortGroupClause's */ 157 158 Node *limitOffset; /* # of result tuples to skip (int8 expr) */ 159 Node *limitCount; /* # of result tuples to return (int8 expr) */
...
180 int stmt_len; /* length in bytes; 0 means "rest of string" */ 181 } Query;

在Query中，此次最关注的是由$tables_or_sub_queries解析得来的Query->rtable。Query->rtable是一个RangeTblEntry的列表，用于表示$tables_or_sub_queries中的以下几种类型:

表
子查询，表示出另外一个子句，但不包含子句中的Query，而是由RangeTblEntry中的subquery来描述其对应的Query
JOIN，除了将JOIN相关的表添加到Query->rtable外，还会加入一个RangeTblEntry表示JOIN表达式用于后面的执行计划
函数

同时也会添加到相应的ParseState->p_joinlist，后转换为FromExpr作为Query->jointree。后面的执行计划生成阶段主要依赖Query->jointree和Query->rtable用于处理pathkey相关的信息。

执行计划生成

在SQL的操作中，几乎所有的操作(比如查询)最终都会落在实际的表上，那么在执行计划中表的表示就比较重要。PostgreSQL用RelOptInfo结构体来表示，如下:

518 typedef struct RelOptInfo
519 {
520 NodeTag type;
521 522 RelOptKind reloptkind;
523 524 /* all relations included in this RelOptInfo */ 525 Relids relids; /* set of base relids (rangetable indexes) */ 526
...
537 538 /* materialization information */ 539 List *pathlist; /* Path structures */ 540 List *ppilist; /* ParamPathInfos used in pathlist */ 541 List *partial_pathlist; /* partial Paths */ 542 struct Path *cheapest_startup_path;
543 struct Path *cheapest_total_path;
544 struct Path *cheapest_unique_path;
545 List *cheapest_parameterized_paths;
...
552 /* information about a base rel (not set for join rels!) */ 553 Index relid;
554 Oid reltablespace; /* containing tablespace */ 555 RTEKind rtekind; /* RELATION, SUBQUERY, FUNCTION, etc */
...
562 List *indexlist; /* list of IndexOptInfo */ 563 List *statlist; /* list of StatisticExtInfo */
...
584 /* used by various scans and joins: */ 585 List *baserestrictinfo; /* RestrictInfo structures (if base rel) */ 586 QualCost baserestrictcost; /* cost of evaluating the above */ 587 Index baserestrict_min_security; /* min security_level found in
588 * baserestrictinfo */ 589 List *joininfo; /* RestrictInfo structures for join clauses
...
595 } RelOptInfo;

事实上，RelOptInfo是执行计划路径生成的主要数据结构，同样用于表述表、子查询、函数等。

在SQL查询中，JOIN是最为耗时，执行计划的生成首先考虑JOIN。因此，整个执行计划路径的入口即为一个JOIN类型的RelOptInfo。当只是单表的查询时，则执行计划入口为这张表的RelOptInfo。

执行计划的生成过程，就是从下往上处理到最上层的RelOptInfo->pathlist的过程，选择有成本较优先节点、删除无用节点，最后得到一个成本最优的执行计划。

在整个过程中，大约分为以下几步:

获取表信息
创建表RelOptInfo，将所有该表的扫瞄路径加入到该表的RelOptInfo->pathlist
创建JOIN的RelOptInfo，将所有可能的JOIN顺序和方式以Path结构体添加到RelOptInfo->pathlist
针对JOIN的RelOptInfo，添加GROUP BY、ORDER BY等节点

生成范围表的扫瞄节点

执行计划一开始，即首先将获取所有的表信息，并以RelOptInfo(baserel)存放在PlannerInfo结构体中的simple_rel_array中，如RelOptInfo中的indexlist用于表示这张表的索引信息，用于判断是否可以用上索引。

为每张表建立扫瞄路径，一般有顺序扫瞄和索引扫瞄两种。扫瞄路径用Path结构体来表示，并存放在该表对应的RelOptInfo->pathlist中。Path结构体如下:

 948 typedef struct Path
949 {
950 NodeTag type;
951 952 NodeTag pathtype; /* tag identifying scan/join method */ 953 954 RelOptInfo *parent;
/* the relation this path can build
*/ 955 PathTarget *pathtarget;
/* list of Vars/Exprs, cost, width
*/ 956 957 ParamPathInfo *param_info;
/* parameterization info, or NULL if none
*/ 958 959 bool parallel_aware;
/* engage parallel-aware logic?
*/ 960 bool parallel_safe;
/* OK to use as part of parallel plan?
*/ 961 int parallel_workers;
/* desired # of workers; 0 = not parallel
*/ 962 963 /* estimated size/costs for path (see costsize.c for more info)
*/ 964 double rows; /* estimated number of result tuples */ 965 Cost startup_cost;
/* cost expended before fetching any tuples */ 966 Cost total_cost; /* total cost (assuming all tuples fetched)
*/ 967 968 List *pathkeys; /* sort ordering of path's output */ 969 /* pathkeys is a List of PathKey nodes; see above */ 970 } Path;

在添加表的扫瞄路径时，会首先添加顺序扫瞄(seqscan)到这张表的RelOptInfo->pathlist，保证表数据的获取。而后考虑indexscan扫瞄节点等其他方式。

当RelOptInfo->indexlist满足RelOptInfo->baserestrictinfo中的过滤条件，或满足RelOptInfo->joininfo等条件时，则认为index是有效的。然后根据统计信息(如过滤性等)计算成本后，建立index扫瞄节点。

在建立index扫瞄节点时，根据索引建立时的情况(排序顺序、比较操作符等)，创建PathKeys的列表(可能多个字段)，存放在IndexPath->Path->pathkeys中。PathKeys的结构体如下:

830 /*
831 * PathKeys
832 *
833 * The sort ordering of a path is represented by a list of PathKey nodes.
834 * An empty list implies no known ordering. Otherwise the first item
835 * represents the primary sort key, the second the first secondary sort key,
836 * etc. The value being sorted is represented by linking to an
837 * EquivalenceClass containing that value and including pk_opfamily among its
838 * ec_opfamilies. The EquivalenceClass tells which collation to use, too.
839 * This is a convenient method because it makes it trivial to detect
840 * equivalent and closely-related orderings. (See optimizer/README for more
841 * information.)
842 *
843 * Note: pk_strategy is either BTLessStrategyNumber (for ASC) or
844 * BTGreaterStrategyNumber (for DESC). We assume that all ordering-capable
845 * index types will use btree-compatible strategy numbers.
846 */ 847 typedef struct PathKey
848 {
849 NodeTag type;
850 851 EquivalenceClass *pk_eclass; /* the value that is ordered */ 852 Oid pk_opfamily; /* btree opfamily defining the ordering */ 853 int pk_strategy;
/* sort direction (ASC or DESC) */ 854 bool pk_nulls_first; /* do NULLs come before normal values? */ 855 } PathKey;
856

事实上，PathKeys可以用于所有已排过序的RelOptInfo中，用于表示这个表、函数、子查询、JOIN等是有序的，作为上层判断选择Path的依据之一。

在建立除seqscan之外的其他节点时，会与pathlist中已有的每个节点根据启动成本和总体成本做对比(相差在一定比值，默认1%)，则分为四种情况:

新建节点和已有节点，其中一方启动成本和总成本都更优，且其pathkeys也更优，那么删除另外一个
新建节点和所有已有节点的启动成本和总成本两方面的对比不一致(如总成本高但启动成本较低，或反过来)，且新建节点总成本较低，则会全部保留并添加到RelOptInfo->pathlist中。
新节点和已有节点，其中一方启动成和总成本都更优，但其pathkeys不够，则两者都保留，由上层Path节点来判断
当新建节点和已有节点成本相同时，则对比两者的pathkeys，选择保留更优pathkeys的节点

此时，即完成一张表所有的Path的生成，保存在该表的RelOptInfo->pathlist中，并从中选择一条成本最低的Path，作为RelOptInfo->cheapest_total_path。索引扫瞄节点的pathkeys将会被上层路径在与排序相关节点中用到，如ORDER BY、GROUP BY、MERGE JOIN等。

生成JOIN节点

JOIN节点生成的算法较为复杂，简单来说，会针对所有参与JOIN的表，动态规划不同的顺序和JOIN方式，然后生成不同的Path加到这个JOIN的RelOptInfo->pathlist中。

最终执行计划的生成

在完成JOIN的各个路径判断后，针对各路径选择成本最低的Path(表的JOIN顺序和JOIN方式)作为最优路径，并依据这个路径上的pathkeys处理ORDER BY、GROUP BY等其他子句的计划，从而完成最终的执行计划。

在前面的介绍中，每张表的RelOptInfo->pathlist中的indexscan的Path都带有pathkeys信息，即表明这个节点执行完之后的结果是按pathkeys来排序的。那么在以下几个地方则可以用到该特性:

MERGE JOIN

在建立JOIN节点时，会有多种JOIN方式可以选择，如NESTLOOP、MERGE JOIN等。当建立了MERGE JOIN节点之后，一般是需要对两张表进行排序。但当某张表的扫瞄节点返回的是有序的，且该顺序与查询所需完全一致，则会去除这个排序节点，从而在成本上占据优势。

ORDER BY

当最终的RelOptInfo节点建立完成后，会拿表RelOptInfo->pathlist中成本最低的Path，与带有pathkeys的Path做成本上的对比，选择成本更低的路径。如果最终是pathkeys的路径，那么该RelOptInfo的pathkeys会保留。

若该SQL语句中带ORDER BY，则可以判断该RelOptInfo的pathkeys是否对ORDER BY(字段和排列顺序一致)，则不必再建立ORDER BY节点。如果pathkeys没有帮助，则会建立排序节点

GROUP BY

GROUP BY有多种方式。如果RelOptInfo中的pathkeys与在解析阶段产生的GROUP BY的pathkeys一致，则从成本上对RelOptInfo结果集的pathkeys对该GROUP BY是否有效，从而可以考虑选用SORT加AGG的方式。这种方式，因为pathkeys的存在，则不必再建SORT 节点。然后再对比与其他方式的成本，择优采用。

子查询

如果JOIN中包含子查询，那么则在JOIN的RelOptInfo->pathlist中添加一个subquery类型的Path，并把子查询中的排序的结果指定为pathkeys放在该Path中。从而上层节点，可以用上面同样的方法，选用该RelOptInfo中最优的Path，并根据pathkeys决定是否需要排序。

总结

通过以上表述，可以说明一条SQL语句的执行计划入口是一个RelOptInfo结构，其中成员pathlist则标示所有不同的查找路径，在这些路径中最终会落在表的RelOptInfo->pathlist中最优的Path中。如果该Path带有pathkeys，那么上层在处理ORT相关的操作时，可以根据pathkeys是否对排序有效而决定是否需要排序节点，从而选择成本更低的路径。

展开阅读全文

博主设置当前文章不允许评论。

PgSQL · 源码分析 · PG 优化器中的pathkey与索引在排序时的使用

PostgreSQL查询优化器详解之逻辑优化篇

Postgresql null值判断，排序，以及排序后对索引的影响

pgsql查询表索引实用情况

PG性能调优工具大全

PostgreSQL 9种索引的原理和应用场景

【Postgresql优化案例】排序与limit组合场景性能极限优化

Postgresql中创建函数索引

postgresql数据库查询所有索引详细信息，包括描述信息

PG重建索引

PostgreSQL中的反转索引(GIN)

postgresql查看表的和索引的情况，判断是否膨胀

MySQL查询优化器源码分析--多表连接优化算法入口，choose_plan()

PostgreSQL中主键索引为什么不能被查询利用到?---索引使用情况一例

postgresql 查看索引、创建、删除索引

postgresql 优化之--不会使用索引

postgresql大数据查询加索引和不加索引耗时总结

PostgreSQL中使用索引的优势和劣势

不同索引类型对Postgresql查询性能的影响(单一索引，覆盖索引，Hash索引)

PostgreSQL查询优化器详解之物理优化篇

【Postgresql】模糊匹配(包括中文前后模糊)

Postgresql中文排序

GreenPlum优化器Orca论文笔记

postgresql重命名索引

《PostgreSQL优化器入门》上线了

PostgreSQL模糊匹配走索引

POSTGRESQL区域设置对索引和排序的影响

PostgreSQL(三)索引&执行计划

PostgreSQL创建索引例子

postgresql 添加/删除unique索引

pgSql分区表新建及过程(BBB,ZJLJB)

PostgreSQL索引创建，查看与删除问题

PostgreSQL 11 新特性之分区索引

hive原理与源码分析-UDxF、优化器及执行引擎(五)

postgreSQL查看索引的使用情况

Mysql优化选择最佳索引的方法

Postgresql 游标的使用教学

Postgresql使用函数初始化所有索引初始值

MySQL5.7官方文档翻译--优化器成本模型

TensorFlow三种常用的优化器

pytorch(六):优化器

keras学习笔记(3)-优化器

tensorflow中各种优化器解析(SGD、Momentum、Adam等)

【caffe 深度学习】3.各类优化器介绍

3.2 详解优化器的选择

tensorflow(6)优化器以及使用

PostgreSQL 之 本地物化视图

pgsql常用函数

Atitit 全文检索 pgsql 艾提拉总结 分词 全文索引的实现要靠 PgSQL 的 gin 索引。分词功能 PgSQL 内置了英文、西班牙文等，但中文分词需要借助开源插件 zhparser;

3用于MNIST的卷积神经网络-3.8使用10种不同的优化器训练模型，观察性能曲线

加速神经网络训练 优化器 optimizer

PostgreSQL 之本地物化视图

Atitit 全文检索 pgsql 艾提拉总结分词全文索引的实现要靠 PgSQL 的 gin 索引。分词功能 PgSQL 内置了英文、西班牙文等，但中文分词需要借助开源插件 zhparser;

加速神经网络训练优化器 optimizer