分布式空间数据库「 3 」
发表于|更新于|空间大数据引擎
|总字数:0|阅读时长:1分钟
文章作者: 西山晴雪
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 西山晴雪的知识笔记!
相关推荐
2020-05-06
非零范围空间对象的索引方法--XZ序曲线索引
XZ-Ordering Method 1 背景 ...
2020-05-04
基于空间填充曲线的降维方法
#refplus, #refplus li{ padding:0; margin:0; list-style:none; }; document.querySelectorAll(".refplus-num").forEach((ref) => { let refid = ref.firstChild.href.replace(location.origin+location.pathname,''); let refel = document.querySelector(refid); let refnum = refel.dataset.num; let ref_content = refel.innerText.replace(`[${refnum}]`,''); tippy(ref, { content: ref_content, ...
2020-05-01
空间大数据引擎综述文章:大数据时代的空间数据引擎
大数据时代的空间数据引擎【摘要】本文是有关分布式空间数据库相关空间大数据库技术的综述性文章,主要包括几个方面:(1)目前三种主要的分布式空间数据库类型;(2)目前三种重要的分布式空间数据库的实现途径;(3)六个分布式数据库重点考虑的技术点,其中核心是空间索引模型、查询方法和查询语言;(4)三类主要的空间索引模型;(5)空间运算及空间查询方法,有关具体查询算法和空间索引模型密切相关,本文不做过多细节展开;(6)空间查询语言,由于目前不是本人关注重点,暂略,待后面补充。希望通过本文的介绍,让同学们能够对当前分布式空间数据库的技术现状有所了解,更多技术细节请参考文中列出的链接或参考文献,自信深入阅读。 一、分布式空间数据库的三种类型 根据目前空间大数据存储、组织和计算的现状,初步梳理如下: 3.1 以专业应用为重点,基于并行数据库的系统 以Parallel...
2020-05-02
基于全文数据库构建分布式空间数据库
...
2020-05-01
基于分布式文件系统实现空间数据引擎
〖 摘 要〗在分布式空间数据库研究的技术体系中,基于成熟数据库实现海量空间数据的组织管理是一种便利的方式,但受限于基底数据库的约束,研究人员很难有更灵活的发挥。因此,直接在分布式文件系统基础上,重新构件分布式空间数据库的方法称为另外一条技术途径。原理上来说,此类方法不能称为严格的空间数据库构建方法,因为其管理的对象大多以静态数据为主,对插入、删除、更新等事物性较强的工作较少涉及。此类技术体系中,较为典型的系统是 SptialHadoop 和 HadoopGIS。本文以 SpatialHadoop 作为重点,剖析此类方法中的关键技术点。 1 背景知识 2 SpatialHadoop 架构3 分布式空间数据引擎4 查询方法 5 总结略。 参考文献 明尼苏达大学 Mohamed F. Mokbel、Ahmed Eldawy、Louai Alarabi 等人发表的下列文献: 2013 年,在 VLDB 上发表的A demonstration of spatialhadoop: An efficient...
2020-05-05
分布式空间数据库「 6 」-- 空间填充曲线的聚簇性分析
空间填充曲线的聚簇性分析一、 概述先说结论,作者将曲线分为连续型(Hillbert、Peano等)、近连续型、非连续型(Z序、Morton等)分开讨论。 1.1 关于矩形查询的通用结论(1)对于固定尺寸的“矩形查询 $r$ ”,存在一个平均簇值的最优解(下限)。 (2)上述最优解(下限)受限于 $r$ 的体积(用r中的单元数做量化)和形状(用 $r$中各维度上的边数来量化)。 (3)通常连续性曲线较非连续型曲线更接近最优解(下限)。 (4)对于固定尺寸的“矩形查询 $r$ “ ,仅考虑部分旋转集时,总是构造一种连续型曲线,使其平均簇值达到最优值(下限)。 (5)对于固定尺寸的“矩形查询 $r$”,考虑其全旋转集时,所有连续型曲线的平均簇值都是最优解。 1.2 关于连续型曲线的结论(1)对于连续型填充曲线,通过将某个查询 $g$ 在各维度上做所有可能的平移后,得出统计结论: 该情况下,查询 $g$ 的平均簇值仅和 $g$ 的体积(用 $g$ 内的单元数做量化)、形状(用 $g$...