F.9. cube

这个模块实现了一种数据类型cube来表示多维立方体。

F.9.1. 语法

表 F-3展示了cube类型有效的外部表示。xy等表示浮点数。

表 F-3. 立方体外部表示

外部语法含义
x一个一维点(或者长度为零的一维区间)
(x)同上
x1,x2,...,xnn-维空间中的一个点,内部表示为一个零容积立方体
(x1,x2,...,xn)同上
(x),(y)开始于x并且结束于y的一个一维区间,反之亦然。顺序并不重要
[(x),(y)]同上
(x1,...,xn),(y1,...,yn)一个 n-维立方体,用它的对角顶点对表示
[(x1,...,xn),(y1,...,yn)]同上

一个立方体的对角录入的顺序无关紧要。如果需要创建一种统一的"左下 — 右上"的内部表示,cube函数会自动地交换值。当角重合时,cube只存储一个角和一个"is point"标志,这样避免浪费空间。

输入中的空白空间会被忽略,因此[(x),(y)][ ( x ), ( y ) ]相同。

F.9.2. 精度

值在内部被存储为 64 位浮点数。这意味着超过 16 位有效位的数字将被截断。

F.9.3. 用法

表 F-4展示了为类型cube提供的操作符。

表 F-4. 立方体操作符

操作符结果描述
a = bboolean立方体 a 和 b 相同。
a && bboolean立方体 a 和 b 重叠。
a @> bboolean立方体 a 包含 立方体 b。
a <@ bboolean立方体 a 被包含在立方体 b 中。
a < bboolean立方体 a 小于立方体 b。
a <= bboolean立方体 a 小于或者等于立方体 b。
a > bboolean立方体 a 大于立方体 b。
a >= bboolean立方体 a 大于或者等于立方体 b。
a <> bboolean立方体 a 不等于立方体 b。
a -> nfloat8得到立方体的第n个坐标(从 1 开始数)。
a ~> nfloat8"一般化"立方体表达中得到第n个坐标, 在这种形式中坐标已经被重新整理成"左下 — 右上"的形式。也就是说每个维度上较小的端点会先出现。
a <-> bfloat8a 和 b 之间的欧氏距离。
a <#> bfloat8a 和 b 之间的直线距离(taxicab 距离,L1 度量)。
a <=> bfloat8a 和 b 之间的切比雪夫(L-inf 度量)距离。

(在 PostgreSQL 8.2 之前,包含操作符@><@分别被称为@~。这些名称仍然可用,但是已经被废弃并且最终将会退休。注意旧的名字与之前核心几何数据类型遵循的习惯相反!)

标量排序操作符(<>=等)除了用来排序之外没有什么实际用途。这些操作符首先比较第一个坐标,如果它们相等再比较第二个坐标等等。它们主要为支持cube的 b-树索引操作符类而存在,这类操作符对支持cube列上的 UNIQUE 约束等很有用。

cube模块也为cube值提供了一个 GiST 索引操作符类。cube GiST 索引可以被用于在WHERE子句中通过=&&@>以及<@操作符来搜索值。

此外,cube GiST 索引可以被用在ORDER BY子句中通过度量操作符<-><#><=>来查找最近邻。例如, 3-D 点(0.5, 0.5, 0.5)的最近邻可以用下面的查询很快地找到:

SELECT c FROM test ORDER BY c <-> cube(array[0.5,0.5,0.5]) LIMIT 1;

也可以用这种方式使用~>操作符来高效地检索通过选定坐标排序后的前几个值。例如,可以用下面的查询得到通过第一个坐标(左下角)升序排列后的前几个立方体:

SELECT c FROM test ORDER BY c ~> 1 LIMIT 5;

以及得到通过右上角第一个坐标降序排列后的 2-D 立方体:

SELECT c FROM test ORDER BY c ~> 3 DESC LIMIT 5;

表 F-5展示了可用的函数。

表 F-5. 立方体函数

函数结果描述例子
cube(float8)cube制造一个一维立方体,坐标都是相同的。 cube(1) == '(1)'
cube(float8, float8)cube制造一个一维立方体。 cube(1,2) == '(1),(2)'
cube(float8[])cube使用数组定义的坐标制造一个零容积的立方体。 cube(ARRAY[1,2]) == '(1,2)'
cube(float8[], float8[])cube用由两个数组定义的右上和左下坐标制造一个立方体,两个数组必须等长。 cube(ARRAY[1,2], ARRAY[3,4]) == '(1,2),(3,4)'
cube(cube, float8)cube在一个现有的立方体上增加一维来制造一个新立方体,对新坐标的各个端点都采用相同的值。这可以用于从计算得到的值逐渐地构建立方体。 cube('(1,2),(3,4)'::cube, 5) == '(1,2,5),(3,4,5)'
cube(cube, float8, float8)cube在一个现有的立方体上增加一维来制造一个新立方体。这可以用于从计算得到的值逐渐地构建立方体。 cube('(1,2),(3,4)'::cube, 5, 6) == '(1,2,5),(3,4,6)'
cube_dim(cube)integer返回该立方体的维数 cube_dim('(1,2),(3,4)') == '2'
cube_ll_coord(cube, integer)float8返回一个立方体的左下角的第 n个坐标值 cube_ll_coord('(1,2),(3,4)', 2) == '2'
cube_ur_coord(cube, integer)float8返回一个立方体的右上角的第n个坐标值 cube_ur_coord('(1,2),(3,4)', 2) == '4'
cube_is_point(cube)boolean如果一个立方体是一个点则返回真,也就是两个定义点相同。 
cube_distance(cube, cube)float8返回两个立方体之间的距离。如果两个都是点,这就是普通距离函数。  
cube_subset(cube, integer[])cube从一个现有的立方体制造一个新立方体,使用来自于一个数组的维索引列表。它可以被用来抽取一个单一维度的端点,或者它可以被用来去除维度,或者按照需要对它们重新排序。 cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[2]) == '(3),(7)' cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[3,2,1,1]) == '(5,3,1,1),(8,7,6,6)'
cube_union(cube, cube)cube产生两个立方体的并  
cube_inter(cube, cube)cube产生两个立方体的交  
cube_enlarge(c cube, r double, n integer)cube用一个指定的半径r在至少n个维度上增加立方体的尺寸。如果该半径是负值,则该立方体会收缩。这有助于围绕一个点创建一个外包盒来搜索附近点。所有已定义的维度都会按照半径r被改变。左下坐标按照r被减小并且右上坐标按照r被增加。如果一个左下坐标被增加得超过对应的右上坐标(这只会发生在r< 0 时),则两个坐标会被设置为它们的均值。如果n大于已定义的维度数并且该立方体被增加(r >= 0), 则额外的维度会被加入以让维度数达到n,对于额外的坐标将使用 0 作为初始值。这个函数可用来创建围绕一个点的外包盒以搜索临近点。 cube_enlarge('(1,2),(3,4)', 0.5, 3) == '(0.5,1.5,-0.5),(3.5,4.5,0.5)'

F.9.4. 默认值

我相信这个并:

select cube_union('(0,5,2),(2,3,1)', '0');
cube_union
-------------------
(0, 0, 0),(2, 5, 2)
(1 row)

不会与常识矛盾,下面的交也不会

select cube_inter('(0,-1),(1,1)', '(-2),(2)');
cube_inter
-------------
(0, 0),(1, 0)
(1 row)

在所有不同维度立方体的二元操作中,我假定低纬度的那一个要做笛卡尔投影,即为字符串表示中被省略的坐标取零。上面的例子等同于:

cube_union('(0,5,2),(2,3,1)','(0,0,0),(0,0,0)');
cube_inter('(0,-1),(1,1)','(-2,0),(2,0)');

下列包含谓词使用点语法,不过实际上第二个参数在内部被表示为一个盒子。这种语法让我们不必定义一种单独的点类型以及用于(盒子, 点)谓词的函数。

select cube_contains('(0,0),(1,1)', '0.5,0.5');
cube_contains
--------------
t
(1 row)

F.9.5. 注解

用法的例子可见回归测试sql/cube.sql

为了不容易出问题,对于立方体的维度数有 100 的限制。如果你想要更大的立方体,可以在cubedata.h中修改。

F.9.6. 工作人员

原作者:Gene Selkov, Jr. ,数学与计算机科学部,阿尔贡国家实验室。

我的感谢主要要献给 Joe Hellerstein 教授(http://db.cs.berkeley.edu/jmh/),他阐明了 GiST (http://gist.cs.berkeley.edu/),还要送给他以前的学生 Andy Dong,他为 Illustra 编写了例子。我也对所有的 Postgres 开发者(现在的和以前的)心存感激,他们让我能够创造自己的世界并且宁静地生活在其中。我也要感谢阿尔贡实验室和美国能源局对我多年数据库研究的支持。

这个包的小更新由 Bruno Wolff III 于 2002 年 8/9 月完成。这些修改包括将精度从单精度改为双精度以及增加了一些新的函数。

额外的更新由 Joshua Reich 在 2006 年 7 月做出。其中包括cube(float8[], float8[])并且将代码从废弃的 V0 协议改到 V1 调用协议。