分布式空间数据库「 6 」-- 空间填充曲线的聚簇性分析
空间填充曲线的聚簇性分析
一、 概述
先说结论,作者将曲线分为连续型(Hillbert、Peano等)、近连续型、非连续型(Z序、Morton等)分开讨论。
1.1 关于矩形查询的通用结论
(1)对于固定尺寸的“矩形查询 rrr ”,存在一个平均簇值的最优解(下限)。
(2)上述最优解(下限)受限于 rrr 的体积(用r中的单元数做量化)和形状(用 rrr中各维度上的边数来量化)。
(3)通常连续性曲线较非连续型曲线更接近最优解(下限)。
(4)对于固定尺寸的“矩形查询 rrr “ ,仅考虑部分旋转集时,总是构造一种连续型曲线,使其平均簇值达到最优值(下限)。
(5)对于固定尺寸的“矩形查询 rrr”,考虑其全旋转集时,所有连续型曲线的平均簇值都是最优解。
1.2 关于连续型曲线的结论
(1)对于连续型填充曲线,通过将某个查询 ggg 在各维度上做所有可能的平移后,得出统计结论:
该情况下,查询 ggg 的平均簇值仅和 ggg 的体积(用 ggg 内的单元数做量化)、形状(用 ggg 在各维度上边的数量来量化),以及填充曲线中各维度的边占比有关(用填充曲线中各维度上 ...