select

SYNOPSIS

SELECT [ ALL | DISTINCT [ ON (  expression [, ...] ) ] ]
    * |  expression [ AS output_name ] [, ...]
    [ FROM  from_item [, ...] ]
    [ WHERE  condition ]
    [ GROUP BY  expression [, ...] ]
    [ HAVING  condition [, ...] ]
    [ { UNION | INTERSECT | EXCEPT } [ ALL ]  select ]
    [ ORDER BY  expression [ ASC | DESC | USING operator ] [, ...] ]
    [ LIMIT {  count | ALL } ]
    [ OFFSET  start ]
    [ FOR UPDATE [ OF  table_name [, ...] ] ]

where  from_item can be one of:

    [ ONLY ]  table_name [ * ] [ [ AS ] alias [ ( column_alias [, ...] ) ] ]
    (  select ) [ AS ] alias [ ( column_alias [, ...] ) ]
     function_name ( [ argument [, ...] ] ) [ AS ] alias [ ( column_alias [, ...] | column_definition [, ...] ) ]
     function_name ( [ argument [, ...] ] ) AS ( column_definition [, ...] )
     from_item [ NATURAL ] join_type from_item [ ON join_condition | USING ( join_column [, ...] ) ]

[Comment: FIXME: This last syntax is incorrect if the join type is an INNER or OUTER join (in which case one of NATURAL, ON ..., or USING ... is mandatory, not optional). What's the best way to fix this?]

DESCRIPTION 描述

SELECT 將從一個或更多表中返回記錄行。 SELECT 通常的處理如下：

1.: 計算列出在 FROM 中的所有元素。（FROM 中的每個元素都是一個真正的或者虛擬的表。）如果在 FROM 列表裡聲明瞭多過一個元素，那麼他們就交叉連線在一起。（參閱下面的 FROM Clause [ ] ）。

2.: 如果聲明瞭 WHERE 子句，那麼在輸出中消除所有不滿足條件的行。（參閱下面的 WHERE Clause [ ] ）。

3.: 如果聲明瞭 GROUP BY 子句，輸出就分成匹配一個或多個數值的不同組裡。如果出現了 HAVING 子句，那麼它消除那些不滿足給出條件的組。（參閱下面的 GROUP BY Clause [ ] 和 HAVING Clause [ ] ）。

4.: 使用 UNION，INTERSECT，和 EXCEPT，我們可以把多個 SELECT 語句的輸出合併成一個結果集。UNION 運算子返回在兩個結果集或者其中一箇中的行， INTERSECT 運算子返回嚴格地在兩個結果集中都有的行。 EXCEPT 運算子返回在第一個結果集中，但是不在第二個結果集中的行。不管哪種情況，重複的行都被刪除，除非聲明瞭 ALL。（參閱下面的 UNION Clause [ ], INTERSECT Clause [select(l)], 和 EXCEPT Clause [ ] ）。

5.: 實際輸出行的時候，SELECT 先為每個選出的行計算輸出表達式（參閱下面的 SELECT List [ ] ）。

6.: 如果聲明瞭 ORDER BY 子句，那麼返回的行是按照指定的順序排序的。如果沒有給出 ORDER BY，那麼資料行是按照系統認為可以最快生成的方法給出的。（參閱下面的 ORDER BY Clause [ ] ）。

7.: 如果給出了 LIMIT 或者 OFFSET 子句，那麼 SELECT 語句只返回結果行的一個子集。（參閱下面的 LIMIT Clause [ ] ）。

8.: DISTINCT 從結果中刪除那些重複的行。 DISTINCT ON 刪除那些匹配所有指定表示式的行。 ALL （預設）將返回所有候選行，包括重複的。（參閱下面的 DISTINCT Clause [ ] ）。

9.: FOR UPDATE 子句導致 SELECT 語句對併發的更新鎖住選定的行。（參閱下面的 FOR UPDATE Clause [ ] ）。

你必須有 SELECT 許可權用來從表中讀取數值。使用 FOR UPDATE 還要求 UPDATE 許可權。

PARAMETERS 引數

FROM 子句

FROM 子句為 SELECT 宣告一個或者多個源表。如果聲明瞭多個源表，那麼結果就是所有源表的笛卡兒積（交叉連線）。但是通常我們會新增一些條件，把返回行限制成笛卡兒積的一個小的結果集。

FROM-子句可以包括：

table_name: 一個現存的表或檢視的名字（可以有模式修飾）。如果聲明瞭ONLY，則只掃描該表。如果沒有宣告ONLY，該表和所有其派生表（如果有的話）都被掃描。可以在表名後面跟一個*來表示掃所有其後代表，但在目前的版本里，這是預設特性。（在 PostgreSQL 7.1 以前的版本里，ONLY是預設特性。）預設的特性可以透過修改配置選項 sql_interitance 來改變。

alias: 為那些包含別名的 FROM 專案取的別名。別名用於縮寫或者在自連線中消除歧義（自連線裡，同一個表掃描了多次）。如果提供了別名，那麼它就會完全隱藏表或者函式的實際名字；比如，如果給出 FROM foo AS f，那麼 SELECT 剩下的東西必須吧這個 FROM 項以 f 而不是 foo 引用。如果寫了別名，我們也可以提供一個欄位別名列表，這樣可以替換表中一個或者多個欄位的名字。

select: 一個子 SELECT 在 FROM 子句裡出現的。它的輸出作用好象是為這條 SELECT 命令在其生存期裡建立一個臨時表。請注意這個子 SELECT 必須用園括弧包圍。並且必須給它加別名。

function_name: 函式呼叫可以出現在 FROM 子句裡。（對於那些返回結果集的函式特別有用，但是任何函式都能用。）這麼做就好像在這個 SELECT 命令的生命期中，把函式的輸出建立為一個臨時表一樣。我們也可以使用別名。如果寫了別名，我們還可以寫一個欄位別名列表，為函式返回的複合型別的一個或多個屬性提供名字替換。如果函式定義為了 record 資料型別，那麼必須出現一個 AS 關鍵字或者別名，後面跟著一個欄位定義列表，形如：( column_name data_type [, ... ])。這個欄位定義列表必須匹配函式返回的欄位的實際數目和型別。

join_type

•: [ INNER ] JOIN

•: LEFT [ OUTER ] JOIN

•: RIGHT [ OUTER ] JOIN

•: FULL [ OUTER ] JOIN

•: CROSS JOIN

之一。就 INNER 和 OUTER 連線型別，我們必須宣告一個連線條件，也就是說一個 NATURAL， ON join_condition，或者 USING (join_column [, ...])。見下文獲取它們的含義，對於 CROSS JOIN，這些子句都不能出現。

一個 JOIN 子句，組合了兩個 FROM 項。必要時使用圓括弧以決定巢狀的順序。如果沒有圓括弧，JOIN 的巢狀從左向右。在任何情況下，JOIN 都比逗號分隔的 FROM 項繫結得更緊。

CROSS JOIN 和 INNER JOIN 生成一個簡單的笛卡兒積，和你在 FROM 的頂層列出兩個項的結果相同。 CROSS JOIN 等效於 INNER JOIN ON (true)，也就是說，沒有被條件刪除的行。這種連線型別只是符號上的方便，因為它們和你用簡單的 FROM 和 WHERE 乾的事情是一樣的。

LEFT OUTER JOIN 返回有條件的笛卡兒積（也就是說，所有組合出來的行都通過了連線條件）中的行，加上左手邊的表中沒有對應的右手邊表的行可以一起匹配透過連線條件的那些行。這樣的左手邊的行擴充套件成連線生成表的全長，方法是在那些右手邊表對應的欄位位置填上空。請注意，只有在決定那些行是匹配的時候，之計算 JOIN 子句自己的條件。外層的條件是在這之後施加的。

對應的是，RIGHT OUTER JOIN 返回所有連接出來的行，加上每個不匹配的右手邊行（左邊用空值擴充套件）。這只是一個符號上的便利，因為我們總是可以把它轉換成一個 LEFT OUTER JOIN，只要把左邊和右邊的輸入對掉一下即可。

FULL OUTER JOIN 返回所有連接出來的行，加上每個不匹配的左手邊的行（右邊用空值擴充套件），加上每個不匹配的右手邊的行（左邊用空值擴充套件）。

ON join_condition: join_condition 是一個表示式，生成型別為 boolean 的結果（類似WHERE 子句），表示連線中那些行被認為是匹配的。

USING (join_column [, ...]): 一個形如 USING ( a, b, ... ) 的子句，是ON left_table.a = right_table.a AND left_table.b = right_table.b ... 的縮寫。同樣，USING 蘊涵著：每對等效欄位中只有一個包含在連線輸出中，而不是兩個都輸出的意思。

NATURAL: NATURAL 是一個 USING 列表的縮寫，這個列表說的是兩個表中同名的的欄位。

WHERE 子句

可選的 WHERE 條件有如下常見的形式：

WHERE  condition

這裡 condition 可以是任意生成型別為 boolean 的表示式。任何不滿足這個條件的行都會從輸出中刪除。如果一個行的數值替換到條件的引用中計算出來的條件為真，那麼該行就算滿足條件。

GROUP BY 子句

可選的 GROUP BY 子句的一般形式

GROUP BY  expression [, ...]

GROUP BY 將把所有在組合了的表示式上共享同樣的值的行壓縮成一行。 expression 可以是一個輸入欄位名字，或者是一個輸入欄位（SELECT 列表）的序號，或者也可以是任意從輸入欄位值形成的任意表達式。在有歧義的情況下，一個 GROUP BY 的名字將被解釋成輸入欄位的名字，而不是輸出欄位的名字。

如果使用了聚集函式，那麼就會對組成一組的所有行進行計算，為每個組生成一個獨立的值（而如果沒有 GROUP BY，那麼聚集對選出來的所有行計算出一個值）。如果出現了 GROUP BY，那麼 SELECT 列表表示式中再引用那些沒有分組的欄位就是非法的，除非放在聚集函數里，因為對於未分組的欄位，可能會返回多個數值。

HAVING 子句

可選的 HAVING 子句有如下形式：

HAVING  condition

這裡 condition 和為 WHERE 子句裡宣告的相同。

HAVING 去除了一些不滿足條件的組行。 HAVING 與 WHERE 不同： WHERE 在使用 GROUP BY 之前過濾出單獨的行，而 HAVING 過濾由 GROUP BY 建立的行。在 condition 裡引用的每個欄位都必須無歧義地引用一個分組的行，除非引用出現在一個聚集函數里。

UNION 子句

UNION 子句的一般形式是：

select_statement UNION [ ALL ] select_statement

這裡 select_statement 是任意沒有 ORDER BY，LIMIT，或者 FOR UPDATE 子句的 SELECT語句。（如果用圓括弧包圍，ORDER BY 和 LIMIT 可以附著在子表示式裡。如果沒有圓括弧，這些子句將交給 UNION 的結果使用，而不是給它們右手邊的輸入表示式。）

UNION 運算子計算那些涉及到的所有 SELECT 語句返回的行的結果聯合。一個行如果至少在兩個結果集中的一個裡面出現，那麼它就會在這兩個結果集的集合聯合中。兩個做為 UNION 直接運算元的SELECT必須生成相同數目的欄位，並且對應的欄位必須有相容的資料型別。

預設地，UNION 的結果不包含任何重複的行，除非聲明瞭 ALL 子句。 ALL 制止了消除重複的動作。

同一SELECT語句中的多個 UNION 運算子是從左向右計算的，除非用圓括弧進行了標識。

目前，FOR UPDATE 不能在 UNION 的結果或輸入中宣告。

INTERSECT 子句

INTERSECT 子句的一般形式是：

select_statement INTERSECT [ ALL ] select_statement

select_statement 是任何不帶 ORDER BY， LIMIT，或者 FOR UPDATE 子句的 SELECT 語句。

INTERSECT 計算涉及的 SELECT 語句返回的行的集合交集。如果一個行在兩個結果集中都出現，那麼它就在兩個結果集的交集中。

NTERSECT 的結果不包含任何重複行，除非你聲明瞭 ALL 選項。用了 ALL 以後，一個在左手邊的表裡有 m 個重複而在右手邊表裡有 n 個重複的行將出現 min(m,n) 次。

除非用圓括號指明順序，同一 SELECT 語句中的多個 INTERSECT 運算子是從左向右計算的。 INTERSECT 比 UNION 繫結得更緊 --- 也就是說 A UNION B INTERSECT C 將讀做 A UNION (B INTERSECT C)，除非你用圓括弧宣告。

EXCEPT 子句

EXCEPT 子句有如下的通用形式：

select_statement EXCEPT [ ALL ] select_statement

這裡 fIselect_statement 是任何沒有 ORDER BY，LIMIT，或者 FOR UPDATE 子句的 SELECT 表示式。

EXCEPT 運算子計算存在於左邊SELECT 語句的輸出而不存在於右邊語句輸出的行。

EXCEPT 的結果不包含任何重複的行，除非聲明瞭 ALL 選項。使用 ALL 時，一個在左手邊表中有 m 個重複而在右手邊表中有 n 個重複的行將出現 max(m-n,0) 次。

除非用圓括弧指明順序，同一 SELECT 語句中的多個 EXCEPT 運算子是從左向右計算的。 EXCEPT 和 UNION 繫結級別相同。

SELECT 列表

SELECT 列表（在關鍵字 SELECT 和 FROM) 之間的東西）宣告一個表示式，這個表示式形成 SELECT 語句的輸出行。這個表示式可以（通常也的確是）引用那些在 FROM 子句裡計算的欄位。透過使用 AS output_name，我們可以為一個輸出行宣告另外一個名字。這個名字主要用做顯示該行的標籤。它也可以在 ORDER BY 和 GROUP BY 子句裡當作欄位值的引用，但是不能在 WHERE 或者 HAVING 子句裡這麼用；在那裡，你必須寫出表示式。

除了表示式之外，我們也可以在輸出列表上寫一個 * 表示選出的行的所有欄位的縮寫。同樣，我們可以寫 table_name.* 作為來自某個特定表的欄位的縮寫。

ORDER BY 子句

可選的 ORDER BY 子句有下面的一般形式：

ORDER BY  expression [ ASC | DESC | USING operator ] [, ...]

expression 可以是一個輸出欄位（SELECT 列表）的名字或者序號，或者也可以是用輸入欄位的數值組成的任意表達式。

ORDER BY 子句導致結果行根據指定的表示式進行排序。如果根據最左邊的表示式，兩行的結果相同，那麼就根據下一個表示式進行比較，依此類推。如果對於所有宣告的表示式他們都相同，那麼以隨機順序返回。

序數指的是列/欄位按順序（從左到右）的位置。這個特性讓我們可以對沒有唯一名稱的列/欄位進行排序。這一點從來不是必須的，因為總是可以透過 AS 子句給一個要計算的列/欄位賦予一個名稱。

在 ORDER BY 裡還可以使用任意表達式，包括那些沒有出現在SELECT結果列表裡面的欄位。因此下面的語句現在是合法的：

SELECT name FROM distributors ORDER BY code;

這個特性的一個侷限就是應用於 UNION，INTERSECT，或者 EXCEPT 查詢的 ORDER BY 子句只能在一個輸出欄位名或者數字上宣告，而不能在一個表示式上宣告。

請注意如果一個 ORDER BY 表示式是一個簡單名稱，同時匹配結果欄位和輸入欄位， ORDER BY 將把它解釋成結果欄位名稱。這和 GROUP BY 在同樣情況下做的選擇正相反。這樣的不一致是由 SQL 標準強制的。

我們可以給 ORDER BY 子句裡每個列/欄位加一個關鍵字 DESC （降序）或 ASC（升序）。如果不宣告， ASC 是預設。我們還可以在 USING 子句裡宣告一個排序運算子來實現排序。 ASC 等效於使用 USING < 而 DESC 等效於使用 USING >。 (But the creator of a user-defined data type can define exactly what the default sort ordering is, and it might correspond to operators with other names.)

在一個域裡，空值排序時排在其它數值前面。換句話說，升序排序時，空值排在末尾，而降序排序時空值排在開頭。

字元型別的資料是按照區域相關的字符集順序排序的，這個區域是在資料庫叢集初始化的時候建立的。

LIMIT 子句

LIMIT 子句由兩個獨立的子句組成：

LIMIT {  count | ALL }
OFFSET  start

這裡 count 宣告返回的最大行數，而 start 宣告開始返回行之前忽略的行數。
.PP
LIMIT 允許你檢索由查詢其他部分生成的行的某一部分。如果給出了限制計數，那麼返回的行數不會超過哪個限制。如果給出了一個偏移量，那麼開始返回行之前會忽略那個數量的行。

在使用 LIMIT 時，一個好習慣是使用一個 ORDER BY 子句把結果行限制成一個唯一的順序。否則你會得到無法預料的查詢返回的子集 --- 你可能想要第十行到第二十行，但以什麼順序？除非你宣告 ORDER BY，否則你不知道什麼順序。

查詢最佳化器在生成查詢規劃時把 LIMIT 考慮進去了，所以你很有可能因給出的 LIMIT 和 OFFSET 值不同而得到不同的規劃（生成不同的行序）。因此用不同的 LIMIT/OFFSET 值選擇不同的查詢結果的子集將不會產生一致的結果，除非你用 ORDER BY 強制生成一個可預計的結果順序。這可不是毛病；這是 SQL 生來的特點，因為除非用了 ORDER BY 約束順序， SQL 不保證查詢生成的結果有任何特定的順序。

DISTINCT 子句

如果聲明瞭 DISTINCT，那麼就從結果集中刪除所有重複的行（每個有重複的組都保留一行）。 ALL 宣告相反的作用：所有行都被保留；這個是預設。

DISTINCT ON ( expression [, ...] ) 只保留那些在給出的表示式上運算出相同結果的行集合中的第一行。 DISTINCT ON 表示式是使用與 ORDER BY （見上文）相同的規則進行解釋的。請注意，除非我們使用了 ORDER BY 來保證我們需要的行首先出現，否則，每個 "第一行" 是不可預測的。比如，

SELECT DISTINCT ON (location) location, time, report
    FROM weather_reports
    ORDER BY location, time DESC;

為每個地點檢索最近的天氣報告。但是如果我們沒有使用 ORDER BY 來強制對每個地點的時間值進行降序排序，那麼我們就會得到每個地點的不知道什麼時候的報告。

DISTINCT ON 表示式必須匹配最左邊的 ORDER BY 表示式。 ORDER BY 子句將通常包含額外的表示式來判斷每個 DISTINCT ON 組裡面需要的行的優先順序。

FOR UPDATE 子句

FOR UPDATE 子句有下面的形式

FOR UPDATE [ OF  table_name [, ...] ]

FOR UPDATE 令那些被 SELECT 語句檢索出來的行被鎖住，就像要更新一樣。這樣就避免它們在當前事務結束前被其它事務修改或者刪除；也就是說，其它檢視 UPDATE，DELETE，或者 SELECT FOR UPDATE 這些行的事務將被阻塞，直到當前事務結束。同樣，如果一個來自其它事務的 UPDATE， DELETE，或者 SELECT FOR UPDATE 已經鎖住了某個或某些選定的行，SELECT FOR UPDATE 將等到那些事務結束，並且將隨後鎖住並返回更新的行（或者不返回行，如果行已經被刪除）。更多的討論參閱 Chapter 12 ``Concurrency Control'' 。

如果特定的表在 FOR UPDATE 中，那麼只有來自這些表中的行才被鎖住；任何在 SELECT 中使用的其它表都只是和平常一樣讀取。

FOR UPDATE 不能在那些無法使用獨立的表資料行清晰標識返回行的環境裡；比如，它不能和聚集一起使用。

FOR UPDATE 可以在 LIMIT 前面出現，主要是為了和 7.3 之前的 PostgreSQL 相容。不過，它在 LIMIT 後面執行更高效，因此我們建議放在 LIMIT 後面。

EXAMPLES 例子

將表 films 和表 distributors 連線在一起：

SELECT f.title, f.did, d.name, f.date_prod, f.kind
    FROM distributors d, films f
    WHERE f.did = d.did

       title       | did |     name     | date_prod  |   kind
-------------------+-----+--------------+------------+----------
 The Third Man     | 101 | British Lion | 1949-12-23 | Drama
 The African Queen | 101 | British Lion | 1951-08-11 | Romantic
 ...

統計用kind 分組的所有電影和組的列/欄位的 len（長度）的和：

SELECT kind, sum(len) AS total FROM films GROUP BY kind;

   kind   | total
----------+-------
 Action   | 07:34
 Comedy   | 02:58
 Drama    | 14:28
 Musical  | 06:42
 Romantic | 04:38

統計所有電影（films），組的列/欄位 len（長度）的和，用 kind 分組並且顯示小於5小時的組總和：

SELECT kind, sum(len) AS total
    FROM films
    GROUP BY kind
    HAVING sum(len) < interval '5 hours';

   kind   | total
----------+-------
 Comedy   | 02:58
 Romantic | 04:38

下面兩個例子是根據第二列（name）的內容對單獨的結果排序的經典的方法：

SELECT * FROM distributors ORDER BY name;
SELECT * FROM distributors ORDER BY 2;

 did |       name
-----+------------------
 109 | 20th Century Fox
 110 | Bavaria Atelier
 101 | British Lion
 107 | Columbia
 102 | Jean Luc Godard
 113 | Luso films
 104 | Mosfilm
 103 | Paramount
 106 | Toho
 105 | United Artists
 111 | Walt Disney
 112 | Warner Bros.
 108 | Westward

下面這個例子演示如何獲得表 distributors 和 actors的連線，只將每個表中以字母 W 開頭的取出來。因為只取了不相關的行，所以關鍵字 ALL 被省略了：

distributors:               actors:
 did |     name              id |     name
-----+--------------        ----+----------------
 108 | Westward               1 | Woody Allen
 111 | Walt Disney            2 | Warren Beatty
 112 | Warner Bros.           3 | Walter Matthau
 ...                         ...

SELECT distributors.name
    FROM distributors
    WHERE distributors.name LIKE 'W%'
UNION
SELECT actors.name
    FROM actors
    WHERE actors.name LIKE 'W%';

      name
----------------
 Walt Disney
 Walter Matthau
 Warner Bros.
 Warren Beatty
 Westward
 Woody Allen

這個例子顯示瞭如何在 FROM 子句中使用一個函式，包括帶有和不帶欄位定義列表的。

CREATE FUNCTION distributors(int) RETURNS SETOF distributors AS '
    SELECT * FROM distributors WHERE did = $1;
´ LANGUAGE SQL;

SELECT * FROM distributors(111);
 did |    name
-----+-------------
 111 | Walt Disney

CREATE FUNCTION distributors_2(int) RETURNS SETOF record AS '
    SELECT * FROM distributors WHERE did = $1;
´ LANGUAGE SQL;

SELECT * FROM distributors_2(111) AS (f1 int, f2 text);
 f1  |     f2
-----+-------------
 111 | Walt Disney

COMPATIBILITY 相容性

當然，SELECT 語句和 SQL 標準相容。但是還有一些擴充套件和一些缺少的特性。

省略 FROM 子句

PostgreSQL 允許我們在一個查詢裡省略 FROM 子句。它的最直接用途就是計算簡單的常量表達式的結果：

SELECT 2+2;

 ?column?
----------
        4

其它有些 SQL 資料庫不能這麼做，除非引入一個單行的偽表做 SELECT 的資料來源。

這個特性的另外一個不太明顯的用途是把一個普通的從一個或多個表的 SELECT 縮寫：

SELECT distributors.* WHERE distributors.name = 'Westward';

 did |   name
-----+----------
 108 | Westward

這樣也可以執行是因為我們給 SELECT 中引用了但沒有在 FROM 中提到的每個表都加了一個隱含的 FROM 項。

儘管這是個很方便的寫法，但它卻容易誤用。比如，下面的查詢

SELECT distributors.* FROM distributors d;

可能就是個錯誤；使用者最有可能的意思是

SELECT d.* FROM distributors d;

而不是下面的他實際上得到的無約束的連線

SELECT distributors.* FROM distributors d, distributors distributors;

為了幫助檢測這種錯誤， PostgreSQL 以及以後的版本將在你使用一條即有隱含 FROM 特性又有明確的 FROM 子句的查詢的時候給出警告。 Also, it is possible to disable the implicit-FROM feature by setting the ADD_MISSING_FROM parameter to false.

2003-11-02

SQL - Language Statements