什么是SQL?

肖钟城
  • 大数据技术栈
  • MySQL
大约 13 分钟

什么是SQL?

SQL(Structured Query Language,结构化查询语言)是一种特定目的编程语言,用于管理关系数据库管理系统(RDBMS),或在关系流数据管理系统(RDSMS)中进行流处理。

SQL基于关系代数和元组关系演算,包括一个数据定义语言和数据操纵语言。SQL的范围包括数据插入、查询、更新和删除,数据库模式创建和修改,以及数据访问控制。尽管SQL经常被描述为,而且很大程度上是一种声明式编程(4GL),但是其也含有过程式编程的元素。

SQL是对埃德加·科德的关系模型的第一个商业化语言实现,这一模型在其1970年的一篇具有影响力的论文《一个对于大型共享型数据库的关系模型》中被描述。尽管SQL并非完全按照科德的关系模型设计,但其依然成为最为广泛运用的数据库语言。

SQL在1986年成为美国国家标准学会(ANSI)的一项标准,在1987年成为国际标准化组织(ISO)标准。此后,这一标准经过了一系列的增订,加入了大量新特性。虽然有这一标准的存在,但大部分的SQL代码在不同的数据库系统中并不具有完全的跨平台性。

历史

在1970年代初,由IBM公司San Jose,California研究实验室open in new window(IBM San Jose Research Laboratory)的埃德加·科德open in new window发表将资料组成表格的应用原则(Codd's Relational Algebra)。1974年,同一实验室的D.D.Chamberlinopen in new windowR.F. Boyceopen in new window对Codd's Relational Algebra在研制关系数据库管理系统System Ropen in new window中,研制出一套规范语言-SEQUEL(Structured English Query Language),并在1976年11月的IBM Journal of R&Dopen in new window上公布新版本的SQL(叫SEQUEL/2)。1980年改名为SQL。

1979年甲骨文公司open in new window首先提供商用的SQL,IBM公司在DB2open in new window和SQL/DS数据库系统中也实现了SQL。

1986年10月,美国ANSI采用SQL作为关系数据库管理系统的标准语言(ANSI X3. 135-1986),后为国际标准化组织(ISO)采纳为国际标准。

1989年,美国ANSI采纳在ANSI X3.135-1989报告中定义的关系数据库管理系统的SQL标准语言,称为ANSI SQL 89,该标准替代ANSI X3.135-1986版本。该标准为下列组织所采纳:

  • 国际标准化组织(ISO),为ISO 9075-1989报告“Database Language SQL With Integrity Enhancement”
  • 美国联邦政府,发布在The Federal Information Processing Standard Publication(FIPS PUB)127

目前,所有主要的关系数据库管理系统支持某些形式的SQL,大部分数据库至少遵守ANSI SQL89标准。

ANSI SQL92标准在交叉连接(cross join)和内部连接之上,新增加了外部连接,并支持在FROM子句中写连接表达式。支持集合的并运算、交运算。支持Case (SQL)open in new window表达式。支持CHECK约束。创建临时表。支持cursor。支持事务隔离open in new window

语法

SQL语言分成了几种要素,包括:

语言特点

SQL是高级的非过程化编程open in new window语言,它允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解其具体的数据存放方式。而它的界面,能使具有底层结构完全不同的数据库系统和不同数据库之间,使用相同的SQL作为数据的输入与管理。它以记录项目〔records〕的合集(set)〔项集,record set〕作为操纵对象,所有SQL语句接受项集作为输入,回提交的项集作为输出,这种项集特性允许一条SQL语句的输出作为另一条SQL语句的输入,所以SQL语句可以嵌套,这使它拥有极大的灵活性和强大的功能。在多数情况下,在其他编程语言中需要用一大段程序才可实践的一个单独事件,而其在SQL上只需要一个语句就可以被表达出来。这也意味着用SQL可以写出非常复杂的语句,在不特别考虑性能下。

SQL同时也是数据库文件格式open in new window扩展名open in new window

SQL包含四个部分:

SQL函数

函数描述
AVG平均值
COUNT计数(不含Null)
FIRST第一个记录的值
MAX最大值
MIN最小值
STDEV样本标准差
STDEVP总体标准差
SUM求和
VAR样本方差
VARP总体方差
UCASE转化为全大写字母
LCASE转化为全小写字母
MID取中值
LEN计算字符串长度
INSTR获得子字符串在母字符串的起始位置
LEFT取字符串左边子串
RIGHT取字符串右边子串
ROUND数值四舍五入取整
MOD取余
NOW获得当前时间的值
FORMAT字符串格式化
DATEDIFF获得两个时间的差值

互操作性和标准化

供应商之间的SQL实现不兼容,不一定完全遵循标准。各种数据库的SQL方言通常不可移植,特别是在日期时间语法、字符串连接、NULL、比较的大小写敏感方面。只有PostgreSQLopen in new windowMimer SQLopen in new window努力遵从标准。

标准化历史

SQL在1986年被ANSI标准化,1987年被ISO标准化。由ISO/IEC JTC 1, Information technology, Subcommittee SC 32, Data management and interchangeopen in new window维护。标准名称通常为如下模式:ISO/IEC 9075-n:yyyy Part n: title

年份名字别名注释
1986SQL-86SQL-87ANSI首次标准化
1989SQL-89FIPSopen in new window 127-1小修改,增加了integrity constraint
1992SQL-92open in new windowSQL2, FIPS 127-2大修改,成为现代SQL的基础
1999SQL:1999open in new windowSQL3增加了正则表达式匹配、递归查询(传递闭包)、数据库触发器、过程式与控制流语句、非标量类型(arrays)、面向对象特性。在Java中嵌入SQL(SQL/OLBopen in new window)及其逆(SQL/JRTopen in new window)
2003SQL:2003open in new window增加XMLopen in new window相关特性(SQL/XMLopen in new window)、window functions、标准化sequences、自动产生值的列。对SQL:1999的新特性重新描述其内涵。
2006SQL:2006open in new window导入/导出XML数据与SQL数据库。XQueryopen in new window
2008SQL:2008open in new window在cursor之外的ORDER BY语句。INSTEAD OF触发器。TRUNCATE语句。FETCH子句
2011SQL:2011open in new window增加时态数据(PERIOD FOR)。增强了_window functions_与FETCH子句
2016SQL:2016open in new window增加行模式匹配、多态表函数、JSONopen in new window
2019SQL:2019增加了第15部分,多维数组(MDarray类型和运算符)。

当前标准

该标准通常用以下模式表示:ISO/IEC 9075-n:yyyy 第n部分:标题,或者简称为ISO/IEC 9075

ISO / IEC 9075补充了ISO / IEC 13249:SQL多媒体和应用程序包(SQL/MM),该程序包定义了基于SQL的接口和包,给诸如视频,音频和空间数据之类的广泛的应用程序。感兴趣的各方可以从ISO、IEC或ANSI购买SQL标准文档。SQL:2008的草稿可作为zipopen in new window存档免费获得。

SQL标准剖析

SQL标准包含10部分:

  • ISO/IEC 9075-1:2016 Part 1: Framework (SQL/Framework). 提供逻辑概念
  • ISO/IEC 9075-2:2016 Part 2: Foundation (SQL/Foundation). 包含语言的主要内容,强制与可选特性。
  • ISO/IEC 9075-3:2016 Part 3: Call-Level Interface (SQL/CLIopen in new window). 定义了接口成分(structures, procedures, variable bindings) 用于编写能执行SQL的应用程序的语言:Ada,C/C++,COBOL,Fortran,MUMPS,Pascal,PL/I。对于Java语言见标准第10部分。ODBCopen in new window是一个著名的SQL/CLI的超集。这部分标准主要包含强制的特性。
  • ISO/IEC 9075-4:2016 Part 4: Persistent stored modules (SQL/PSMopen in new window)。SQL的过程式扩展,包括控制流、条件处理、语句条件signals与resignals、cursors、本地变量、表达式赋值到变量与参数。此外,SQL/PSM形式化声明与维护了持续性(persistent)数据库语言例程(例如存储过程)。这部分标准主要包含可选的特性。
  • Part-6open in new window页面存档备份open in new window,存于互联网档案馆open in new window): Support for JavaScript Object Notation (JSON). 2017年首次集成JSON数据类型到SQL标准。
  • ISO/IEC 9075-9:2016 Part 9: Management of External Data (SQL/MEDopen in new window). 这部分标准主要包含可选的特性。
  • ISO/IEC 9075-10:2016 Part 10: Object language bindings (SQL/OLBopen in new window)。定义了SQLJopen in new window,SQL嵌入到Java,保证了SQLJ应用程序二进制可移植。这部分标准主要包含可选的特性。
  • ISO/IEC 9075-11:2016 Part 11: Information and definition schemas (SQL/Schemataopen in new window). 定义了Information Schema与Definition Schema,提供了常用工具集使得SQL数据库与对象自描述。这些工具包括SQL object identifier、structure与integrity constraints、security与authorization specifications, features与packages。这部分标准主要包含强制与可选的特性。
  • ISO/IEC 9075-13:2016 Part 13: SQL Routines and types using the Java TM programming language (SQL/JRTopen in new window). SQL应用程序调用静态方法作为子程序的能力('Java-in-the-database');Java类作为SQL结构化用户定义类型。这部分标准主要包含可选的特性。
  • ISO/IEC 9075-14:2016 Part 14: XML-Related Specifications (SQL/XMLopen in new window). 这部分标准主要包含可选的特性。
  • ISO/IEC 9075-15:2019 Part 15: 多维数组(SQL/MDA)。 它为SQL指定了多维数组类型(MDarray),以及对MDarray,MDarray切片,MDarray单元和相关功能的操作。 标准的这一部分仅包含可选功能。

ISO / IEC标准的扩展

ISO/IEC 9075_被_ISO/IEC 13249: SQL Multimedia and Application Packages (SQL/MM)补充。后者定义了基于SQL的音视频、空间数据的界面与包。包括:

  • ISO/IEC 13249-1:2016 Part 1: Framework
  • ISO/IEC 13249-2:2003 Part 2: Full-Text
  • ISO/IEC 13249-3:2016 Part 3: Spatial
  • ISO/IEC 13249-5:2003 Part 5: Still image
  • ISO/IEC 13249-6:2006 Part 6: Data mining
  • ISO/IEC 13249-7:2013 Part 7: History
  • ISO/IEC 13249-8:xxxx Part 8: Metadata Registry Access MRAopen in new window (work in progress)

以SQL为基础的其他延伸语言

微软MS SQL-Serveropen in new window,以及Sybase Adaptive Serveropen in new window系列数据库所用的SQL

Oracleopen in new window 数据库open in new window所使用的SQL

安全问题

由于SQL指令在部分高级使用时,语法会依照特定条件来变换,而且若是表格中的字段过多时,许多开发人员都会习惯以字符串组立的方式创建SQL指令,而且又使用系统管理员级的账户连到数据库,因此让黑客有机会利用SQL的组立方式进行攻击,像是在指令中添加部分刺探性或破坏性的指令(例如DROP TABLEDROP DATABASE或是DELETE * FROM myTable等具破坏性的指令),让数据库的资料或实体服务器被破坏,导致服务中断或是系统瘫痪等后果,或是以逻辑的漏洞,在密码栏写入特殊字符串(例如' or '1'='1),让该字符串形成的逻辑判断永远为真,或直接获取非查询条件的资料,而不需要知道密码,以达成非法登录系统的目的,此种攻击手法称为SQL注入(SQL injection)。

目前实务上较有效的防御方法,就是全面改用参数化查询。

参考文献

Paul, Ryan. A guided tour of the Microsoft Command Shell. Ars Technica. [10 April 2011]. (原始内容存档于2018-12-25).

Media Type registration for application/sql. Internet Assigned Numbers Authority. 10 April 2013 [10 April 2013]. (原始内容存档于2018-01-24).

The application/sql Media Type, RFC 6922. Internet Engineering Task Force: 3. April 2013 [10 April 2013]. (原始内容存档于2016-10-18).

Beaulieu, Alan. Mary E Treseler , 编. Learning SQL 2nd. Sebastapol, CA, USA: O'Reilly. April 2009. ISBN 978-0-596-52083-0.

SQL, n.. Oxford English Dictionary. Oxford University Press. [2014-11-27].

Encyclopedia Britannica. SQL. [2013-04-02]. (原始内容存档于2018-12-25).

From Oxford Dictionaries: "Definition of SQL - abbreviation, Structured Query Language, an international standard for database manipulation." Oxford Dictionaries. SQL. [2017-10-10]. (原始内容存档于2016-08-03).

IBM. SQL Guide.[永久失效链接]

From Microsoft: "Structured Query Language, invented at IBM in the 1970s. It is more commonly known by its acronym, SQL .." Microsoft. Structured Query Language (SQL). [2017-10-10]. (原始内容存档于2016-03-12).

Codd, Edgar F. A Relational Model of Data for Large Shared Data Banks. Communications of the ACM (Association for Computing Machinery). June 1970, 13 (6): 377–87 [2007-06-09]. doi:10.1145/362384.362685. (原始内容存档于2007-06-12).

Chapple, Mike. SQL Fundamentals. Databases. About.comopen in new window. [2009-01-28]. (原始内容存档于2009-02-22).

Structured Query Language (SQL). International Business Machines. October 27, 2006 [2007-06-10].

ISO/IEC 9075-1:2008: Information technology – Database languages – SQL – Part 1: Framework (SQL/Framework). [2017-10-10]. (原始内容存档于2012-02-03).

ANSI/ISO/IEC International Standard (IS). Database Language SQL—Part 2: Foundation (SQL/Foundation). 1999.

评论
  • 按正序
  • 按倒序
  • 按热度
Powered by Waline v2.14.1