openGauss内核分析(九):数据库表的创建过程

掌握命运 · 发表于 2022-12-24 12:38:49

Gauss松鼠会
学习探索分享数据库前沿知识和技术共建数据库技术交流圈
关注
执行引擎位于优化器和存储引擎之间，负责将数据从存储引擎读取出来，根据计划将数据处理加工返回给客户端。执行器接收到的指令就是优化器应对SQL查询而翻译出来的关系代数运算符所组成的执行树，如下图所示：

openGauss内核分析(九):数据库表的创建过程w2.jpg

图中每一个方块代表一个具体关系运算代数符，我们称之为算子，每个算子有统一的接口，从下层的一个或者多个算子获得输入，然后将运算结果返回给上层算子。整个查询执行过程主要是两个流，驱动流和数据流。

执行器的整体目标就是在每一个由优化器构建出来的执行树上，通过控制流驱动数据流在执行树上高效的流动，其流动的速度决定了执行器的处理效率。
openGauss内核分析(九):数据库表的创建过程w3.jpg

算子分类

关系数据库本身是对关系集合Relation的运算操作，执行引擎作为运算的控制逻辑主体也是围绕着关系运算来实现的，在传统数据库实现理论中，算子的分类可以分成以下几类：

扫描算子（Scan Plan Node）

扫描节点负责从底层数据来源抽取数据，数据来源可能是来自文件系统，也可能来自网络（分布式查询）。一般而言扫描节点都位于执行树的叶子节点，作为执行树PlanTree的数据输入来源。

关键特征：输入数据、叶子节点、表达式过滤
openGauss内核分析(九):数据库表的创建过程w4.jpg

控制算子（Control Plan Node）

控制算子一般不映射代数运算符，通常是为了执行器完成一些特殊的流程引入的算子。

关键特征：用于控制数据流程
openGauss内核分析(九):数据库表的创建过程w5.jpg

物化算子（Materialize Plan Node）

物化算子一般指算法要求，在做算子逻辑处理的时候，要求把下层的数据进行缓存处理，因为对于下层算子返回的数据量不可提前预知，因此需要在算法上考虑数据无法全部放置到内存的情况。
关键特征：需要扫描所有数据之后才返回
openGauss内核分析(九):数据库表的创建过程w6.jpg

连接算子（Join Plan Node）

这类算子是为了应对数据库中最常见的关联操作。

关键特征：多个输入。
按照实现方式有3种关联算子。
openGauss内核分析(九):数据库表的创建过程w7.jpg

按照连接类型有6种关联算子。

openGauss内核分析(九):数据库表的创建过程w8.jpg

下面重点分析Seqscan算子的代码流程。

Seqscan 算子

openGauss内核分析(九):数据库表的创建过程w10.jpg

ExecInitSeqScan

ExecInitSeqScan函数初始化SeqScan状态节点，负责节点状态结构构造。
SeqScanState* ExecInitSeqScan(SeqScan* node, EState* estate, int eflags){ ……/*    * create state structure    */ SeqScanState* scanstate = makeNode(SeqScanState); // SeqScan状态节点 scanstate->ps.plan = (Plan*)node; scanstate->ps.state = estate; scanstate->isPartTbl = node->isPartTbl; scanstate->currentSlot = 0; scanstate->partScanDirection = node->partScanDirection; scanstate->rangeScanInRedis = {false,0,0};    ……/*    * tuple table initialization    */ InitScanRelation(scanstate, estate, eflags); // 初始化扫描表 ……/*    * initialize scan relation    */    InitSeqNextMtd(node, scanstate); // 设定获取元组的函数    ……    return scanstate;}
InitSeqNextMtd函数设定获取元组的函数为SeqNext。
staticinlinevoidInitSeqNextMtd(SeqScan* node, SeqScanState* scanstate){if (!node->tablesample) {       scanstate->ScanNextMtd = SeqNext; ……}
ExecSeqScan

ExecutePlan函数循环调用ExecProcNode获取元组。

staticvoidExecutePlan(EState *estate, PlanState *planstate, CmdType operation, bool sendTuples, long numberTuples,ScanDirection direction, DestReceiver *dest, JitExec::JitContext* motJitContext){ TupleTableSlot *slot = NULL; long current_tuple_count = 0; // 初始化 ……/*    * Loop until we've processed the proper number of tuples from the plan.    */ for (;;) { // 循环调用ExecProcNode ……if (unlikely(recursive_early_stop)) {          slot = NULL;       } elseif (motJitContext && !IS_PGXC_COORDINATOR && JitExec::IsMotCodegenEnabled()) {// MOT LLVMint scanEnded = 0;if (!motFinishedExecution) {// previous iteration has not signaled end of scan             slot = planstate->ps_ResultTupleSlot;uint64_t tuplesProcessed = 0;int rc = JitExec::JitExecQuery(                   motJitContext, estate->es_param_list_info, slot, &tuplesProcessed, &scanEnded);if (scanEnded || (tuplesProcessed == 0) || (rc != 0)) {// raise flag so that next round we will bail out (current tuple still must be reported to user)                   motFinishedExecution = true;             }          } else {             (void)ExecClearTuple(slot);          }       } else {          slot = ExecProcNode(planstate); // 调用ExecProcNode       } ……/*       * if the tuple is null, then we assume there is nothing more to       * process so we just end the loop...       */if (TupIsNull(slot)) { // 元组为空即中止循环if(!is_saved_recursive_union_plan_nodeid) {break;          }          ExecEarlyFreeBody(planstate);break;       } ……       {          (*dest->receiveSlot)(slot, dest); // 简单select语句调用printtup函数       } ……/*       * check our tuple count.. if we've processed the proper number then       * quit, else loop again and process more tuples.  Zero numberTuples       * means no limit.       */       current_tuple_count++; // 计数元组数if (numberTuples == current_tuple_count) {break;       } } ……}
ExecProcNode函数根据nodeTag执行g_execProcFuncTable对应的函数。
TupleTableSlot* ExecProcNode(PlanState* node){ TupleTableSlot* result = NULL; …… {intindex = (int)(nodeTag(node))-T_ResultState;       Assert(index >= 0 && index <= T_StreamState - T_ResultState);       result = g_execProcFuncTable[index](node); } ……return result;}ExecProcFuncTypeg_execProcFuncTable[] = { ExecResultWrap, ……ExecSeqScanWrap, ExecIndexScanWrap, ExecIndexOnlyScanWrap, ……};
ExecSeqScanWrap->ExecSeqScan->ExecScan->ExecScanFetch，ExecScanFetch函数回调SeqNext获取元组。
static TupleTableSlot* ExecScanFetch(ScanState* node, ExecScanAccessMtd access_mtd, ExecScanRecheckMtd recheck_mtd){ ……/*    * Run the node-type-specific access method function to get the next tuple    */return (*access_mtd)(node); // 回调SeqNext}

ExecEndSeqScan

ExecEndSeqScan完成清理工作。

openGauss内核分析(九):数据库表的创建过程w11.jpg

精彩推荐

openGauss内核分析（一）：多线程架构启动过程详解openGauss内核分析（二）：简单查询的执行openGauss内核分析（三）：SQL解析openGauss内核分析（四）：查询重写
openGauss内核分析（五）：统计信息与行数估计

openGauss内核分析（六）：执行计划生成

openGauss内核分析（七）：SQL by pass & 经典执行器

- END -

openGauss内核分析(九):数据库表的创建过程w12.jpg

Gauss松鼠会

汇集数据库从业人员及爱好者互助解决问题共建数据库技术交流圈

账号		自动登录	找回密码
密码			注册

openGauss内核分析(九):数据库表的创建过程

浏览过的版块