`
chinamming
  • 浏览: 141069 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

SQLite剖析(5):体系结构

 
阅读更多
本文整理自http://sqlite.org/arch.html。
本文描述SQLite库的体系结构。这些内容对于那些想了解和修改SQLite内部结构的人将会非常有用。在探索前我们先下载源码包sqlite-src-3071400.zip,在其src目录下包含了所有源码文件。注意若要编译SQLite库则下载单一文件版本sqlite-amalgamation-3071400.zip。

下图是一个体系结构图,显示了SQLite的主要组件以及各组件之间是如何相互关联的。接下来的内容将简要的介绍每个组件。注意这里描述SQLite 3.0版,它和2.8版以及早期的版本基本相似,但在一些细节上是有区别的。

图1 SQLite体系结构

在内部,SQLite由以下几个组件组成:内核、SQL编译器、后端以及附件。SQLite通过利用虚拟机和虚拟数据库引擎(VDBE),使调试、修改和扩展SQLite的内核变得更加方便。所有SQL语句都被编译成易读的、可以在SQLite虚拟机中执行的程序集。SQLite支持大小高达2 TB的数据库,每个数据库完全存储在单个磁盘文件中。这些磁盘文件可以在不同字节顺序的计算机之间移动。这些数据以B+树(B+tree)数据结构的形式存储在磁盘上。SQLite根据该文件系统获得其数据库权限。
1、公共接口(Interface)
SQLite库的大部分公共接口由main.c, legacy.c和vdbeapi.c源文件中的函数来实现,这些函数依赖于分散在其他文件中的一些程序,因为在这些文件中它们可以访问有文件作用域的数据结构。sqlite3_get_table()例程在table.c中实现,sqlite3_mprintf()可在printf.c中找到,sqlite3_complete()则位于tokenize.c中。Tcl接口在tclsqlite.c中实现。SQLite的C接口信息可参考http://sqlite.org/capi3ref.html。
为了避免和其他软件的名字冲突,SQLite库的所有外部符号都以sqlite3为前缀,这些被用来做外部使用的符号(换句话说,这些符号用来形成SQLite的API)是以sqlite3_开头来命名的。
2、词法分析器(Tokenizer)
当执行一个包含SQL语句的字符串时,接口程序要把这个字符串传递给tokenizer。Tokenizer的任务是把原有字符串分割成一个个标识符(token),并把这些标识符传递给解析器。Tokenizer是用手工编写的,在C文件tokenize.c中。
在这个设计中需要注意的一点是,tokenizer调用parser。熟悉YACC和BISON的人们也许会习惯于用parser调用tokenizer。SQLite的作者已经尝试了这两种方法,并发现用tokenizer调用parser会使程序运行的更好。YACC会使程序更滞后一些。
3、语法分析器(Parser)
语法分析器的工作是在指定的上下文中赋予标识符具体的含义。SQLite的语法分析器使用Lemon LALR(1)分析程序生成器来产生,Lemon做的工作与YACC/BISON相同,但它使用不同的输入句法,这种句法更不易出错。Lemon还产生可重入的并且线程安全的语法分析器。Lemon定义了非终结析构器的概念,当遇到语法错误时它不会泄露内存。驱动Lemon的源文件可在parse.y中找到。
因为lemon是一个在开发机器上不常见的程序,所以lemon的源代码(只是一个C文件)被放在SQLite的"tool"子目录下。 lemon的文档放在"doc"子目录下。
4、代码生成器(Code Generator)
语法分析器在把标识符组装成完整的SQL语句后,就调用代码生成器产生虚拟机代码,以执行SQL语句请求的工作。代码生成器包含许多文件:attach.c, auth.c, build.c, delete.c, expr.c, insert.c,pragma.c, select.c, trigger.c, update.c, vacuum.c和where.c。这些文件涵盖了大部分最重要、最有意义的事情。expr.c处理SQL中表达式的代码生成。where.c处理SELECT、UPDATE和DELETE语句中WHERE子句的代码生成。文件attach.c, delete.c, insert.c, select.c, trigger.c, update.c和vacuum.c处理同名SQL语句的代码生成(这些文件在必要时都调用expr.c和where.c中的例程)。所有其他SQL语句的代码由build.c生成。文件auth.c实现sqlite3_set_authorizer()的功能。
5、虚拟机(Virtual Machine)
代码生成器生成的代码由虚拟机来执行。关于虚拟机更详细的信息可参考http://sqlite.org/opcode.html。总的来说,虚拟机实现一个专为操作数据库文件而设计的抽象计算引擎。它有一个存储中间数据的存储栈,每条指令包含一个操作码和不超过三个额外的操作数。
虚拟机本身被完整地包含在一个单独的文件vdbe.c中,它也有自己的头文件,其中vdbe.h定义虚拟机与SQLite库其他部分之间的接口,vdbeInt.h定义虚拟机私有的数据结构。文件vdbeaux.c包含被虚拟机使用的一些工具,和被库的其他部分用来构建VM程序的一些接口模块。文件vdbeapi.c包含虚拟机的外部接口,例如sqlite3_bind_...族的函数。单独的值(字符串、整数、浮点数、BLOB对象)被存储在一个叫Mem的内部对象中,在vdbemem.c中可找到它的实现。
SQLite使用回调风格的C语言程序来实现SQL函数,每个内建的SQL函数都用这种方式来实现。大多数内建的SQL函数(例如coalesce(), count(), substr(), 等等)可在func.c中找到。日期和时间转换函数可在date.c中找到。
6、B-树(B-Tree)
一个SQLite数据库使用B-树的形式存储在磁盘上,B-树的实现位于源文件btree.c中。数据库中的每个表和索引使用一棵单独的B-树,所有的B-树存放在同一个磁盘文件中。文件格式的细节被记录在btree.c开头的备注里。B-树子系统的接口在头文件btree.h中定义。
7、页面高速缓存(Page Cache)
B-树模块以固定大小的数据块形式从磁盘上请求信息,默认的块大小是1024个字节,但是可以在512和65536个字节之间变化。页面高速缓存负责读、写和缓存这些数据块。页面高速缓存还提供回滚和原子提交的抽象,并且管理数据文件的锁定。B-树驱动模块从页面高速缓存中请求特定的页,当它想修改页面、想提交或回滚当前修改时,它也会通知页面高速缓存。页面高速缓存处理所有麻烦的细节,以确保请求能够快速、安全而有效地被处理。
页面高速缓存的代码实现被包含在单一的C源文件pager.c中。页面高速缓存子系统的接口在头文件pager.h中定义。
8、OS接口
为了在POSIX和Win32操作系统之间提供移植性,SQLite使用一个抽象层来提供操作系统接口。OS抽象层的接口在os.h中定义,每种支持的操作系统有各自的实现:Unix使用os_unix.c,Windows使用os_win.c,等等。每个特定操作系统的实现通常都有自己的头文件,如os_unix.h, os_win.h等。
9、实用工具(Utilities)
内存分配和字符串比较函数位于util.c中。语法分析器使用的符号表用Hash表来维护,其实现位于hash.c中。源文件utf.c包含Unicode转换子程序。SQLite有自己的printf()实现(带一些扩展功能),在printf.c中,还有自己的随机数生成器,在random.c中。
10、测试代码(Test Code)
如果你计算回归测试脚本,超过一半的SQLite代码将被测试。主要代码文件中有许多assert()语句。另外,源文件test1.c通过test5.c和md5.c实现只用于测试目的的一些扩展。os_test.c后端接口用来模拟断电,以验证页面高速缓存的崩溃恢复机制。
注:
本来想结合源代码对SQLite 3的体系结构做一番分析,后来发现网上已经有比较好的分析文章。可参考:
SQLite入门与分析:http://www.cnblogs.com/hustcat/category/175618.html。它对SQLite 3的各组件做了深入地分析。在http://sqlite.com.cn/上也有对该系列文章的转载。
SQLite学习手册:http://www.cnblogs.com/stephen-liu74/category/348367.html。也介绍得比较详细,偏向于SQLite的使用介绍。
分享到:
评论

相关推荐

    SQLite学习手册_中文全本

    SQLite具有多方面的...分析器、分词器、虚拟机、Btree算法、高整缓存、程序体系结构,通过这些内容可以搞清楚很多计算机科学的经典概念。SQLite的模块化、小型化和简易性,使你可以很容易地专门研究其中的一个问题。

    Android创建和使用数据库SQLIte

    一、关系型数据库SQLIte  每个应用程序都要使用数据,Android应用程序也不例外,Android使用开源的、与操作系统无关的SQL数据库—...SQLite体系结构图如下:    编译器包括Tokenizer(词法分析器)、 Parser(语法分

    SQLite嵌入式数据库及图象处理技术研究

    对嵌入式数据库特性及体系结构分析的基础上,使用c语言作为调用SQLite数据库的嵌入式语句,设计出了一种嵌入 式数据库SQLite图象处理方法,并将SQLite的源代码直接嵌入到应用程序中,使它们共用相同的进程空间,实现...

    SQLite嵌入式数据库及图象处理技术研究 (2012年)

    对嵌入式数据库特性及体系结构分析的基础上,使用C语言作为调用SQLite数据库的嵌入式语句,设计出了一种嵌入式数据库SQLite图象处理方法,并将SQLite的源代码直接嵌入到应用程序中,使它们共用相同的进程空间,实现...

    iOS应用逆向工程:分析与实战

    前三部分介绍iOS逆向分析领域的背景、知识体系,以及相应的工具集、理论知识;第四部分则通过4个实际案例来将前面的知识以实战的方式展开。第一部分为概念篇,简单介绍iOS逆向分析的概念以及iOS平台系统架构。第二...

    Android课设--学生选课系统-源代码+设计报告

    内容概要:本次设计开发通过研究Android体系结构方面的知识,设计并实现了学生选课系统。能够从学生和管理者两个角度入手,对课程信息进行增加、选课、整理、查看等功能,从而实现随身随地地进行选课活动,也方便...

    通讯录管理系统的设计与实现(论文+源码)-kaic.pdf

    4.1 系统体系结构 4.1.1 系统模块图 4.2 数据库概念结构设计 4.3 数据库逻辑结构设计 第五章 详细设计 5.1 用户管理模块 5.1.1 功能描述 5.1.2 界面设计 5.1.3 程序流程图 5.1.4 程序代码 5.2 用户登录模块 5.2.1 ...

    基于Android系统的课程管理系统设计与实现.doc

    近年来Android得到了社会更多的认同和应用,本文主要概述了Android系统的体系结构,Android应用程序的开发环境和用JAVA语言开发基于Android系统的课程管理系统中的一些技术实现方法,这些技术包括:基于Android系统...

    Android 课表设计.doc

    Android应用程序的多样化对人们快速获取资讯以及方便人们的生活起着不可忽视的作用,近年来Android得到了社会更多的认同和应用,本文主要概述了Android系统的体系结构,Android应用程序的开发环境和使用JAVA语言开发...

    嵌入式Linux程序设计案例与实验教程-实例代码

    4.7.2 OSS设备的体系结构94 4.7.3 OSS驱动分析94 4.7.4 OSS用户空间编程95 实验4.7 Linux音频OSS驱动实验95 综合实验三五子棋游戏的实现97 第5章 嵌入式Linux开源软件移植与应用101 5.1 嵌入式WebServer...

    嵌入式Linux程序设计案例与实验教程(配套光盘)第三部分

    4.7.2 OSS设备的体系结构94 4.7.3 OSS驱动分析94 4.7.4 OSS用户空间编程95 实验4.7 Linux音频OSS驱动实验95 综合实验三五子棋游戏的实现97 第5章 嵌入式Linux开源软件移植与应用101 5.1 嵌入式WebServer Go...

    嵌入式Linux程序设计案例与实验教程(配套光盘)第二部分

    4.7.2 OSS设备的体系结构94 4.7.3 OSS驱动分析94 4.7.4 OSS用户空间编程95 实验4.7 Linux音频OSS驱动实验95 综合实验三五子棋游戏的实现97 第5章 嵌入式Linux开源软件移植与应用101 5.1 嵌入式WebServer Go...

    嵌入式Linux程序设计案例与实验教程(配套光盘)第一部分

    4.7.2 OSS设备的体系结构94 4.7.3 OSS驱动分析94 4.7.4 OSS用户空间编程95 实验4.7 Linux音频OSS驱动实验95 综合实验三五子棋游戏的实现97 第5章 嵌入式Linux开源软件移植与应用101 5.1 嵌入式WebServer Go...

    Android课程设计---基于Android系统的音乐播放器设计与实现.doc

    Android平台五大优势特色: 1、开放性 2、挣脱运营商的束缚 3、丰富的硬件选择 4、不受任何限制的开发商 5、无缝结合的Google应用 图 Android 软件体系结构图 Android作为一个移动设备的平台,其软件层次结构包括...

    Android技术内幕.系统卷(扫描版)

    第2章 android的内核机制和结构剖析 /34 2.1 linux与android的关系 /35 .2.1.1 为什么会选择linux /35 2.1.2 android不是linux /35 2.2 android对linux内核的改动 /37 2.2.1 goldfish /37 2.2.2 yaffs2 /38 2.2.3 ...

    嵌入式\(高校应用案例)北航软件学院

    网络体系结构与协议;局域网;网络互联与TCP/IP协议;Internet及其应用;网络连接设备与技术 •Linux下C开发人员 •面向C嵌入式开发人员 ZKQ090102 Linux安装 正确安装Linux操作系统 ZKQ090103 Linux 开发环境与...

    ASP.NET 3.5 开发大全1-5

    14.5.2 Web服务体系结构 14.5.3 Web服务协议栈 14.6 简单Web Service示例 14.7 自定义Web Service 14.7.1 创建自定义的Web Service 14.7.2 使用自定义的Web Service 14.8 小结 第五篇 ASP.NET 3.5高级编程 第15章 ...

    Android技术内幕.系统卷 pdf

    第2章 android的内核机制和结构剖析 /34 2.1 linux与android的关系 /35 .2.1.1 为什么会选择linux /35 2.1.2 android不是linux /35 2.2 android对linux内核的改动 /37 2.2.1 goldfish /37 2.2.2 yaffs2 /38 ...

    asp.net知识库

    深入剖析ASP.NET组件设计]一书第三章关于ASP.NET运行原理讲述的补白 asp.net 运行机制初探(httpModule加载) 利用反射来查看对象中的私有变量 关于反射中创建类型实例的两种方法 ASP.Net应用程序的多进程模型 NET委托...

Global site tag (gtag.js) - Google Analytics