武汉大学地理信息系统考研复习笔记(3)

本站小编 武汉大学教学队伍/2017-04-09


1)每行都从左到右记录; AAAAABBBAABBAABB
2)奇数行从左到右,偶数行从右到左;
特点:最直观、最基本的网格存贮结构,没有进行任何压缩数据处理。
栅格数据量大,格网数多,由于地理数据往往有较强的相关性,即相邻象元的值往往是相同的。所以,出现了各种栅格数据压缩方法。
数据压缩是将数据表示成更紧凑的格式以减少存储空间的一项技术。分为:
无损压缩:在编码过程中信息没有丢失,经过解码可恢复原有的信息---信息 保持编码。
有损压缩:为最大限度压缩数据,在编码中损失一些认为不太重要的信息,解码后,这部分信息无法恢复。--信息不保持编码。
2、行程编码(变长编码):
将原图表示的数据矩阵变为数据对:
1)属性码,长度,行号(可不要) 长度:连续相同码值的栅格个数。
2)属性码,点位
特点: 对于游程长度编码,区域越大,数据的相关性越强,则压缩越大,适用于类型区域面积较大的专题图,而不适合于类型连续变化或类别区域分散的分类图(压缩比与图的复杂程度成反比)。
  这种编码在栅格加密时,数据量不会明显增加,压缩率高,并最大限度地保留原始栅格结构,编码解码运算简单,且易于检索,叠加,合并等操作,这种编码应用广泛。
3、块码   ----  游程编码向二维扩展
采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格。
数据对组成:(初始行、列,半径,属性值)特点:
具有可变分辨率,即当属性变化小时图块大,对于大块图斑记录单元大,分辨率低,压缩比高。小块图斑记录单元小,分辨率高,压缩比低 所以,与行程编码类似,随图形复杂程度的提高而降低分辩率。
4、链式编码、Freeman 链码、边界链码
将栅格数据(线状地物面域边界)表示为矢量链的记录
1)首先定义一个3x3窗口,中间栅格的走向有8种可能,并将这8种可能0~7进行编码。
2)记下地物属性码和起点行、列后,进行追踪,得到矢量链.
链式编码表 属性码 起点行 起点列 链码
a  1  4  556656  b  3  7  576654323…
优点:链码可有效地存贮压缩栅格数据,便于面积、长度、转折方向和边界、线段凹凸度的计算。
缺点:不易做边界合并,插入操作、编辑较困难(对局部修改将改变整体结构)。区域空间分析困难,相邻区域边界被重复存储。
5、四叉树编码
五、四叉树编码
(一)四叉树概述: 一种可变分率的非均匀网格系统。是最有效的栅格数据压缩编码方法之一
1、  基本思想: 将2n×2n象元组成的图像(不足的用背景补上) 按四个象限进行递归分割,
并判断属性是否单一,  单一:不分。 不单一:递归分割。最后得到一颗四分叉的倒向树。
2、  四叉树的树形表示:
用一倒立树表示这种分割和分割结果。
根:整个区域  高:深度、分几级,几次分割  叶:不能再分割的块  树叉:还需分割的块 每个树叉均有4个分叉,叫四叉树。
3、 编码方法
1)常规四叉树
记录这棵树的叶结点外,中间结点,结点之间的联系用指针联系, 每个结点需要6个变量: 父结点指针、四个子结点的指针和本结点的属性值。 指针不仅增加了数据的存储量,还增加了操作的复杂性:如层次数(分割次数)由从父结点移到根结点的次数来确定,结点所代表的图像块的位置需要从根节点开始逐步推算下来。所以,常规四叉树并不广泛用于存储数据,其价值在于建立索引文件,进行数据检索。
2)线性四叉树
记录叶结点的位置,深度(几次分割)和属性。 地址码(定位码、Morton码)  四进制、十进制
优点:
•存贮量小,只对叶结点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数。
•线性四叉树可直接寻址,通过其坐标值直接计算其Morton码,而不用建立四叉树。
•定位码容易存储和执行实现集合相加等组合操作。
(二)四进制的Morton码
1、  方法1:
四叉树从上而下(形成)(从整体开始) 由叶结点找Morton码。
   A、分割一次,增加一位数字,大分割在前,小分割在后。所以,码的位数表示分割的次数。
   B、每一个位均是不大于3的四进制数,表达位置。 由Morton找出四叉树叶结点的具体位置。
2、  方法2:四叉树自下而上合并的方法
1)计算每个栅格对应的MQ  MQ=2*Ib+Jb  I,J化为二进制Ib,Jb 看最大的I,J,不足在前补零。其始行列号从0计。
2) 按码的升序排成线性表,放在连续的内存块中。
3)依次检查每四个相邻的MQ对应的属性值,相同合并(不同码位去掉),不同则存盘,直到没有能够合并的子块为止。
(三)十进制的Morton码---MD
四进制Morton码直观上切合四叉树分割,但许多语言不支持四进制变量,需用十进制表示Morton码.
1、一种按位操作的方法:
如行为2、列为3的栅格的MD
步骤:
(1)行、列号为二进制 Ib= 1 0  Jb= 1 1
(2)I行J列交叉   1 1 0 1  = 13
(3)再化为十进制. 实质上是按左上、右上、左下、右下的顺序,从零开始对每个栅格进行自然编码。
2、把一幅2n×2n的图像压缩成线性四叉树的过程
1°、按Morton码把图象读入一维数组。
2°、相邻的四个象元比较,一致的合并,只记录第一个象元的Morton码。循环比较所形成的大块,相同的再合并,直到不能合并为止。
3°、进一步用游程长度编码压缩。压缩时只记录第一个象元的Morton码。
右图的压缩处理过程为:(书上)(次题2005年考了,原题没变)
1°、按Morton码读入一维数组。
Morton码:0   1  2   3  4   5  6  7   8  9  10  11   12  13   14  15
象 元 值: A  A  A  B  A  B  B  B  A  A  A   A   B   B   B   B
2°、四相邻象元合并,只记录第一个象元的Morton码。
    0   1  2    3   4  5   6  7   8  12
    A  A  A  B  A  A  B  B  A   B
3°、由于不能进一步合并,则用游程长度编码压缩。
    0  3   4  6  8   12
    A  B  A  B  A  B
(四)四叉树优缺点
优点:
1)对于团块图像,四叉树表示法占用空间比网络法要少得多,四叉树表示法基本上是一种非冗余表示法。2)四叉树具有可变率或多重分辩率的特点使得它有很好的应用前景,适用于处理凝聚性或呈块状分布的空间数据,特别适用于处理分布不均匀的块状空间数据,但不适用于连续表面(如地形)或线状地物。
此外,目前应用四叉树还存下列问题:
1) 矢/栅正反变换还不理想。
2) 建立四叉树耗费机时很多。
3) 四叉树虽可修改,但很费事(具体的数据结构中会提到)
4) 四叉树未能直接表示物体间的拓扑关系。
5) 与非树表示法比较,四叉树表示法的缺点在于转换的不稳定性或叫滑动变异
例如,两个图像的差异仅由于平移,就会构成极为不同的四叉树,因而很难根据四叉树来判断这两个图像是否全同,故不利于做形状分析和模式识别
6) 一个物体的图像在构成四叉树时会被分割到若干个象限中,使它失去了内在的相关性。
§2-2   矢量数据结构
二、矢量数据的获取方式
1) 由外业测量获得
  可利用测量仪器自动记录测量成果(常称为电子手薄),然后转到地理数据库中。
2)由栅格数据转换获得 利用栅格数据矢量化技术,把栅格数据转换为矢量数据。
3)跟踪数字化 用跟踪数字化的方法,把地图变成离散的矢量数据。
三、矢量数据组织
矢量数据表示时应考虑以下问题:
•矢量数据自身的存贮和处理。
•与属性数据的联系。
•矢量数据之间的空间关系(拓扑关系)。
四、矢量数据编码方式
(一)实体式 (spaghetti)--  面条模型:以实体为单位记录其坐标
优点:结构简单、直观、易实现以实体为单位的运算和显示。
缺点: 1、相邻多边形的公共边界被数字化并存储两次,造成数据冗余和碎屑多边形—数据不一致,浪费空间,导致双重边界不能精确匹配。
2、自成体系,缺少多边形的邻接信息,无拓扑关系,难以进行邻域处理,如消除多边形公共边界,合并多边形。
3、岛作为一个单个图形,没有与外界多边形联系。不易检查拓扑错误。
所以,这种结构只用于简单的制图系统中,显示图形。
(二)索引式(树状)
对所有点的坐标按顺序建坐标文件,再建点与边(线)、线与多边形的索引文件。
与实体式相比:
优点:用建索引的方法消除多边形数据的冗余和不一致,邻接信息、岛信息可在多边形文件中通过是否公共弧段号的方式查询。
缺点:表达拓扑关系较繁琐,给相邻运算、消除无用边、处理岛信息、检索拓扑关系等带来困难,以人工方式建立编码表,工作量大,易出错。
三)双重独立式编码
简称DIME(Dual Independent Map Encoding),是美国人口统计系统采用的一种编码方式,是一种拓扑编码结构。
四)链状双重独立式编码--拓扑数据结构
1、弧段坐标文件 弧段号 坐标系列(串)
A       x2,y2,X10,y10…
2、弧段文件:链—面,链—结点关系
弧段号 左多边形 右多边形 起点 终点
A P1 P2 2 5
3、面文件 面号 弧段号
P1 A,B,-C
4、点拓扑文件: 结点—链关系
点号 弧段号
2   A,B,D
在拓扑结构中,多边形(面)的边界被分割成一系列的线(弧、链、边)和点(结点)等拓扑要素,点、线、面之间的拓扑关系在属性表中定义,多边形边界不重复。
链状双重独立式编码 特点
拓扑关系明确,也能表达岛信息,而且以弧段为记录单位,满足实际应用需要。因为一般数字化一条街道时,必然有许多中间点,但我们在做空间分析是却没有必要以这些中间点所组成的折线为研究对象,而应以整条弧段(某条街道)为研究对象.
  被一些成熟的商品化软件采用,如ARC/INFO软件。
例:ARC文件:二进制文件:  弧段号    点数     坐标串
  在GIS数据输入中,建拓扑是指给图形数据(点、线、面)增加拓扑结构,如ARC/INFO中,在ARCEDIT中输入图形后,需用BUILD 建图形拓扑,具体生成许多文件,如AAT,PAT等.
INFO:属性表
如AAT(Arc Attribute Table)
弧段号 USER_ID LPOLY RPOLY FROM_NODE TO_NODE
其它属性:(名称) 用户标识码,表明地物类型
当图形数据修改、删除、增加点、线、面要素后,其拓扑关系也发生改变,所以,需重新建拓扑。
§2-4 矢栅一体化数据结构
一、矢、栅优缺点
             优点
                     缺点
矢量
1、便于面向现象(土壤类,土地利用单元等)
2、结构紧凑,冗余度低,便于描述线或边界。

相关话题/地理信息系统