5.高阶数据过滤「SQL必知必会 第5版」

前言

本系列是个人看 《SQL必知必会(第5版)》 的记录,需要的数据可以通过 建表 导入数据 下载导入.

正文

这一节讲授如何组合 WHERE 子句以建立功能更强、更高级的搜索条件。 我们还将学习如何使用 NOTIN 操作符。

组合 WHERE 子句

上一节介绍的所有 WHERE 子句在过滤数据时使用的都是单一的条件。为 了进行更强的过滤控制,SQL 允许给出多个 WHERE 子句。这些子句有两种使用方式,即以 AND子句或 OR子句的方式使用。

操作符(operator)
用来联结或改变 WHERE 子句中的子句的关键字,也称为逻辑操作符 (logical operator)。

AND操作符

要通过不止一个列进行过滤,可以使用 AND操作符给 WHERE子句附加条件。

输入👇🏻

SELECT prod_id, prod_price, prod_name
FROM Products
WHERE vend_id = 'DLL01' AND prod_price <= 4;

分析👇🏻
SQL 语句检索由供应商 DLL01制造且价格小于等于 4 美元的所有产品的名称和价格。这条 SELECT语句中的 WHERE子句包含两个条件,用 AND 关键字联结在一起。AND 指示 DBMS 只返回满足所有给定条件的行。如果某个产品由供应商 DLL01制造,但价格高于 4 美元,则不检索它。类似地,如果产品价格小于 4 美元,但不是由指定供应商制造的也不被检索。这条 SQL 语句产生的输出如下:

输出👇🏻

prod_id     prod_price     prod_name
------- ---------- --------------------
BNBG02      3.4900         Bird bean bag toy
BNBG01      3.4900         Fish bean bag toy
BNBG03      3.4900         Rabbit bean bag toy

AND
用在 WHERE 子句中的关键字,用来指示检索满足所有给定条件的行。

这个例子只包含一个 AND 子句,因此只有两个过滤条件。可以增加多个过滤条件,每个条件间都要使用 AND关键字。

说明:没有 ORDER BY 子句 为了节省空间,也为了减少你的输入,很多例子里省略了 ORDER BY子句。因此,你的输出完全有可能与例子输出不一致。虽然返回行的数量总是对的,但它们的顺序可能不同。

OR操作符

OR 操作符与 AND 操作符正好相反,它指示 DBMS 检索匹配任一条件的行。事实上,许多 DBMSOR WHERE 子句的第一个条件得到满足的情况下,就不再计算第二个条件了(在第一个条件满足时,不管第二个条件是否满足,相应的行都将被检索出来)。
请看如下的 SELECT语句:

输入👇🏻

SELECT prod_id, prod_price, prod_name 
FROM Products
WHERE vend_id = 'DLL01' OR vend_id = 'BRS01';

分析👇🏻
SQL 语句检索由任一个指定供应商制造的所有产品的产品名和价格。 OR 操作符告诉 DBMS 匹配任一条件而不是同时匹配两个条件。如果这里使用的是 AND 操作符,则没有数据返回(因为会创建没有匹配行的WHERE子句)。这条 SQL 语句产生的输出如下:

输出👇🏻

prod_name               prod_price 
------------------- ----------
Fish bean bag toy       3.4900 
Bird bean bag toy       3.4900 
Rabbit bean bag toy     3.4900 
8 inch teddy bear       5.9900 
12 inch teddy bear      8.9900 
18 inch teddy bear      11.9900 
Raggedy Ann             4.9900

OR
WHERE子句中使用的关键字,用来表示检索匹配任一给定条件的行。

求值顺序

WHERE 子句可以包含任意数目的 ANDOR 操作符。允许两者结合以进行复杂、高级的过滤。
但是,组合 ANDOR 会带来了一个有趣的问题。为了说明这个问题,来看一个例子。假如需要列出价格为 10 美元及以上,且由 DLL01BRS01 制造的所有产品。下面的 SELECT语句使用组合的 ANDOR操作符建立了一个 WHERE子句:

输入👇🏻

SELECT vend_id,prod_name, prod_price 
FROM Products
WHERE vend_id = 'DLL01' OR vend_id = 'BRS01' 
AND prod_price >= 10;

输出👇🏻

vend_id  prod_name               prod_price 
------- ----------------------- ------
BRS01    18 inch teddy bear      11.99
DLL01    Fish bean bag toy       3.49
DLL01    Bird bean bag toy       3.49
DLL01    Rabbit bean bag toy     3.49
DLL01    Raggedy Ann             4.99

分析👇🏻
请看上面的结果。返回的行中有 4 行价格小于 10 美元,显然,返回的行 未按预期的进行过滤。为什么会这样呢?原因在于求值的顺序。SQL(像多数语言一样)在处理 OR操作符前,优先处理 AND操作符。当 SQL 看到上述 WHERE 子句时,它理解为:由供应商 BRS01 制造的价格为 10 美元以上的所有产品,以及由供应商 DLL01 制造的所有产品,而不管其价格如何。换句话说,由于 AND 在求值过程中优先级更高,操作符被错误地组合了。
此问题的解决方法是使用圆括号对操作符进行明确分组。请看下面的SELECT语句及输出:

输入👇🏻

SELECT vend_id, prod_name, prod_price 
FROM Products
WHERE (vend_id = 'DLL01' OR vend_id = 'BRS01') 
AND prod_price >= 10;

输出👇🏻

vend_id prod_name               prod_price 
------- ------------------- ----------
BRS01   18 inch teddy bear      11.9900 

分析👇🏻
这条 SELECT语句与前一条的唯一差别是,将前两个条件用圆括号括了起来。因为圆括号具有比 ANDOR操作符更高的优先级,所以 DBMS 首先 过滤圆括号内的 OR 条件。这时,SQL 语句变成了选择由供应商 DLL01BRS01 制造的且价格在 10 美元及以上的所有产品,这正是我们希望的结果。

提示:在 WHERE子句中使用圆括号
任何时候使用具有 ANDOR 操作符的 WHERE 子句,都应该使用圆括号明确地分组操作符。不要过分依赖默认求值顺序,即使它确实如你希望的那样。使用圆括号没有什么坏处,它能消除歧义。

IN操作符

IN 操作符用来指定条件范围,范围中的每个条件都可以进行匹配。IN取 一组由逗号分隔、括在圆括号中的合法值。下面的例子说明了这个操作符。

输入👇🏻

SELECT vend_id, prod_name, prod_price 
FROM Products
WHERE vend_id  IN ('DLL01','BRS01') 
ORDER BY prod_name;

输出👇🏻

vend_id   prod_name             prod_price 
--------- --------------------- ----------
BRS01     12 inch teddy bear    8.99
BRS01     18 inch teddy bear    11.99
BRS01     8 inch teddy bear     5.99
DLL01     Bird bean bag toy     3.49
DLL01     Fish bean bag toy     3.49
DLL01     Rabbit bean bag toy   3.49
DLL01     Raggedy Ann           4.99

分析👇🏻
SELECT语句检索由供应商 DLL01BRS01制造的所有产品。IN操作符后跟由逗号分隔的合法值,这些值必须括在圆括号中。

你可能会猜测 IN操作符完成了与 OR相同的功能,恭喜你猜对了!下面 的 SQL 语句完成与上面的例子相同的工作。

输入👇🏻

SELECT vend_id, prod_name, prod_price 
FROM Products
WHERE vend_id = 'DLL01' OR vend_id = 'BRS01' 
ORDER BY prod_name;

输出👇🏻

vend_id   prod_name             prod_price 
--------- --------------------- ----------
BRS01     12 inch teddy bear    8.99
BRS01     18 inch teddy bear    11.99
BRS01     8 inch teddy bear     5.99
DLL01     Bird bean bag toy     3.49
DLL01     Fish bean bag toy     3.49
DLL01     Rabbit bean bag toy   3.49
DLL01     Raggedy Ann           4.99

为什么要使用 IN操作符?其优点如下。

  • 在有很多合法选项时,IN操作符的语法更清楚,更直观。
  • 在与其他 ANDOR操作符组合使用 IN 时,求值顺序更容易管理。
  • IN 操作符一般比一组 OR 操作符执行得更快(在上面这个合法选项很 少的例子中,你看不出性能差异)。
  • IN 的最大优点是可以包含其他 SELECT 语句,能够更动态地建立WHERE子句。

IN
WHERE子句中用来指定要匹配值的清单的关键字,功能与 OR相当

NOT操作符

WHERE 子句中的 NOT 操作符有且只有一个功能,那就是否定其后所跟的任何条件。因为 NOT从不单独使用(它总是与其他操作符一起使用),所以它的语法与其他操作符有所不同。NOT关键字可以用在要过滤的列前, 而不仅是在其后。

NOT
WHERE子句中用来否定其后条件的关键字。

下面的例子说明 NOT的用法。为了列出除 DLL01之外的所有供应商制造的产品,可编写如下的代码。

输入👇🏻

SELECT prod_name 
FROM Products
WHERE NOT vend_id = 'DLL01' 
ORDER BY prod_name;

输出👇🏻

prod_name 
------------------ 
12 inch teddy bear 
18 inch teddy bear 
8 inch teddy bear 
King doll
Queen doll 

分析👇🏻
这里的 NOT 否定跟在其后的条件,因此,DBMS 不是匹配 vend_idDLL01,而是匹配非 DLL01之外的所有东西。

上面的例子也可以使用<>操作符来完成,如下所示。
输入👇🏻

SELECT prod_name 
FROM Products
WHERE vend_id  <> 'DLL01' 
ORDER BY prod_name; 

输出👇🏻

prod_name 
------------------ 
12 inch teddy bear 
18 inch teddy bear 
8 inch teddy bear 
King doll
Queen doll 

为什么使用 NOT?对于这里的这种简单的 WHERE 子句,使用 NOT 确实没有什么优势。但在更复杂的子句中,NOT 是非常有用的。例如,在与 IN 操作符联合使用时,NOT 可以非常简单地找出与条件列表不匹配的行。

说明:MariaDB 中的 NOT MariaDB 支持使用 NOT 否定 INBETWEENEXISTS 子句。大多数 DBMS 允许使用 NOT否定任何条件。

小结

本节讲授如何用 ANDOR 操作符组合成 WHERE 子句,还讲授了如何 明确地管理求值顺序,如何使用 INNOT操作符。