数据操纵DML
插入数据
当一个表被创建后,它不包含数据。在数据库可以有点用之前要做的第一件事就是向里面插入数据。数据在概念上是以每次一行地方式被插入的。当然可以每次插入多行,但是却没有办法一次插入少于一行的数据。即使只知道几个列的值,那么也必须创建一个完整的行。
要创建一个新行,使用 INSERT 命令。这条命令要求提供表的名字和其中列的值。例如:
CREATE TABLE products (
product_no integer,
name text,
price numeric
);
一个插入一行的命令将是:
INSERT INTO products VALUES (1, 'Cheese', 9.99);
数据的值是按照这些列在表中出现的顺序列出的,并且用逗号分隔。通常,数据的值是文字(常量),但也允许使用标量表达式。
上面的语法的缺点是必须知道表中列的顺序。要避免这个问题,也可以显式地列出列。例如,下面的两条命令都有和上文那条 命令一样的效果:
INSERT INTO products (product_no, name, price) VALUES (1, 'Cheese', 9.99);
INSERT INTO products (name, price, product_no) VALUES ('Cheese', 9.99, 1);
许多用户认为明确列出列的名字是个好习惯。
如果没有获得所有列的值,那么可以省略其中的一些。在这种情况下,这些列将被填充为它们的缺省值。例如:
INSERT INTO products (product_no, name) VALUES (1, 'Cheese');
INSERT INTO products VALUES (1, 'Cheese');
第二种形式是 AntDB 的一个扩展。它从使用给出的值从左开始填充列,有多少个给出的列值就填充多少个列,其他列的将使用缺省值。
为了保持清晰,也可以显式地要求缺省值,用于单个的列或者用于整个行:
INSERT INTO products (product_no, name, price) VALUES (1, 'Cheese', DEFAULT);
INSERT INTO products DEFAULT VALUES;
可以在一个命令中插入多行:
INSERT INTO products (product_no, name, price) VALUES
(1, 'Cheese', 9.99),
(2, 'Bread', 1.99),
(3, 'Milk', 2.99);
也可以插入查询的结果(可能没有行、一行或多行):
INSERT INTO products (product_no, name, price)
SELECT product_no, name, price FROM new_products
WHERE release_date = 'today';
更新数据
修改已经存储在数据库中的数据的行为叫做更新。可以更新单个行,也可以更新表中所有的行,还可以更新其中的一部分行。 可以独立地更新每个列,而其他的列则不受影响。
要更新现有的行,使用 UPDATE 命令。这需要提供三部分信息:
- 表的名字和要更新的列名
- 列的新值
- 要更新的是哪(些)行
SQL 通常并不为行提供唯一标识符。因此无法总是直接指定需要更新哪一行。但是,可以通过指定一个被更新的行必须满足的条件。只有在表里面存在主键的时候(不管声明它还是不声明它),才能可靠地通过选择一个匹配主键的条件来指定一个独立的行。图形化的数据库访问工具就靠这允许独立地更新某些行。
例如,这条命令把所有价格为 5 的产品的价格更新为 10:
UPDATE products SET price = 10 WHERE price = 5;
这样做可能导致零行、一行或者更多行被更新。如果试图做一个不匹配任何行的更新,那也不算错误。
仔细看看这个命令。首先是关键字 UPDATE
, 然后跟着表名字。和平常一样,表名字也可以是用模式限定的, 否则会从路径中查找它。然后是关键字 SET
, 后面跟着列名、一个等号以及新的列值。新的列值可以是任意标量表达式, 而不仅仅是常量。例如,如果想把所有产品的价格提高 10%,可以用:
UPDATE products SET price = price * 1.10;
如所见,用于新值的表达式也可以引用行中现有的值。还忽略了 WHERE
子句。如果忽略了这个子句, 那么就意味着表中的所有行都要被更新。如果出现了 WHERE
子句, 那么只有匹配它后面的条件的行被更新。请注意在 SET
子句中的等号是一个赋值, 而在 WHERE
子句中的等号是比较,不过这样并不会导致任何歧义。当然 WHERE
条件不一定非得是等值测试。许多其他操作符也都可以使用。但是表达式必须得出一个布尔结果。
还可以在一个 UPDATE
命令中更新更多的列, 方法是在 SET
子句中列出更多赋值。例如:
UPDATE mytable SET a = 5, b = 3, c = 1 WHERE a > 0;
删除数据
和前面增加数据一样,也只能从表中整行整行地删除数据。在前面的一节里解释了 SQL 不提供直接访问单个行的方法。因此,删除行只能是通过指定被删除行必须匹配的条件进行。如果在表上有一个主键,那么可以指定准确的行。但是也可以删除匹配条件的一组行,或者可以一次从表中删除所有的行。
可以使用 DELETE 命令删除行,它的语法和 UPDATE
命令非常类似。例如,要从产品表中删除所有价格为 10 的产品,使用:
DELETE FROM products WHERE price = 10;
如果只是写:
DELETE FROM products;
那么表中所有行都会被删除,程序员一定要注意。
从修改的行中返回数据
有时在修改行的操作过程中获取数据很有用。INSERT
、 UPDATE
和 DELETE
命令都有一个支持这个的可选的 RETURNING
子句。使用 RETURNING
可以避免执行额外的数据库查询来收集数据,并且在否则难以可靠地识别修改的行时尤其有用。
所允许的 RETURNING
子句的内容与 SELECT
命令的输出列表相同 。它可以包含命令的目标表的列名, 或者包含使用这些列的值表达式。一个常见的简写是 RETURNING *
, 它按顺序选择目标表的所有列。
在 INSERT
中,可用于 RETURNING
的数据是插入的行。 这在琐碎的插入中并不是很有用,因为它只会重复客户端提供的数据。 但依赖于计算出的默认值时可以非常方便。例如,当使用 serial
列来提供唯一标识符时, RETURNING
可以返回分配给新行的 ID:
CREATE TABLE users (firstname text, lastname text, id serial primary key);
INSERT INTO users (firstname, lastname) VALUES ('Joe', 'Cool') RETURNING id;
RETURNING
子句对于 INSERT ... SELECT
也非常有用。
在 UPDATE
中,可用于 RETURNING
的数据是被修改行的新内容。 例如:
UPDATE products SET price = price * 1.10
WHERE price <= 99.99
RETURNING name, price AS new_price;
在 DELETE
中,可用于 RETURNING
的数据是删除行的内容。例如:
DELETE FROM products
WHERE obsoletion_date = 'today'
RETURNING *;
如果目标表上有触发器,可用于 RETURNING
的数据是被触发器修改的行。因此,检查由触发器计算的列是 RETURNING
的另一个常见用例。