武汉大学地理信息系统考研复习笔记(7)

本站小编 武汉大学教学队伍/2017-04-09


   4)、Lambert投影中,地球表面上两点间的最短距离(即大圆航线)表现为近于直线,这有利于地理信息系统中空间分析量度的正确实施。 。
2、GIS中地图投影设计与配置的一般原则
§4-3 空间数据的分类和编码
一、空间数据的组织
二、地理数据的分层
空间数据可按某种属性特征形成一个数据层,通常称为图层(Coverage)。
1、空间数据分层方法:
1)专题分层
     每个图层对应一个专题,包含某一种或某一类数据。如地貌层、水系层、道路层、居民地层等。
2)时间序列分层
即把不同时间或不同时期的数据作为一个数据层。
3)地面垂直高度分层
把不同时间或不同时期的数据作为一个数据层。
2、空间数据分层的目的
便于空间数据的管理、查询、显示、分析等。
1)空间数据分为若干数据层后,对所有空间数据的管理就简化为对各数据层的管理,而一个数据层的数据结构往往比较单一,数据量也相对较小,管理起来就相对简单;
2)对分层的空间数据进行查询时,不需要对所有空间数据进行查询,只需要对某一层空间数据进行查询即可,因而可加快查询速度;
3)分层后的空间数据,由于便于任意选择需要显示的图层,因而增加了图形显示的灵活性;
4)对不同数据层进行叠加,可进行各种目的的空间分析。
三、空间数据的分类与编码
1、属性数据编码
在属性数据中,有一部分是与几何数据的表示密切有关的。
例如,道路的等级、类型等,决定着道路符号的形状、色彩、尺寸等。
在GIS中,通常把这部分属性数据用编码的形式表示,并与几何数据一起管理起来。
    编码:是指确定属性数据的代码的方法和过程。
    代码:是一个或一组有序的易于被计算机或人识别与处理的符号,是计
算机鉴别和查找信息的主要依据和手段。
    编码的直接产物就是代码,而分类分级则是编码的基础。
2、分类编码的原则
分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属
性或特征的事物或现象分开的过程。
分类是人类思维所固有的一种活动,是认识事物的一种方法。
分类的基本原则是:
科学性、系统性、可扩性、实用性、兼容性、
稳定性、不受比例尺限制、灵活性

3、分类码和标识码
§4.4 空间数据的采集
一、输入前准备
1、  资料准备,区域标定
1)基础原始数据的确定
2)数据分类项目的确定
3)数据标准的准确性的确定
2、进行三个统一: (地理基础统一,即确定投影、比例尺、分类分级编码)
3、所用软件的检查、试用菜单准备及其它辅助工作。
4、硬件检查。
5、精度试验。
6、试验,样区、单项试验。
二、几何图形数据的采集
一)手工数字化
1、手工矢量数字化
(二)数字化仪数字化
§4.4 空间数据的采集
2、用数字化软件进行数字化
2、手工栅格数字化
(以上资料4。4节来源于张超主编的《地理信息系统实习教程》所配光盘)
1、扫描矢量化处理流程:
三)扫描矢量化
2、屏幕跟踪矢量化流程
三、属性数据采集
1、键盘,人机对话方式
2、程序批量输入。
四、属性和几何数据的连接
1、可手工输入
2、由系统自动生成(如用顺序号代表标识符)
五、空间数据的编辑和检核
1、空间数据输入的误差
1)几何数据的不完整或重复。
2)几何数据的位置不正确。
3)比例尺不正确。
4)变形。
5)几何数据与属性数据的连接有误。
6)属性数据错误、不完整。
键盘输入错误,漏输数据或属性错误分类、编码等。
2、空间数据的检查
1)通过图形实体与其属性的联合显示,发现数字化中的遗漏、重复、不匹配等错误;    
2)在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误;
3)把数字化的结果绘图输出在透明材料上,然后与原图叠加以发现错漏;
4)对等高线,通过确定最低和最高等高线的高程及等高距,编制软件来检查高程
的赋值是否正确;
5)对于面状要素,可在建立拓扑关系时,根据多边形是否闭合来检查,或根据多
边形与多边形内点的匹配来检查等;
6)对于属性数据,通常是在屏幕上逐表、逐行检查,也可打印出来检查;
7)对于属性数据还可编写检核程序,如有无字符代替了数字,数字是否超出了范围,等等;
8)对于图纸变形引起的误差,应使用几何纠正来进行处理。
§4.5  GIS的数据质量
一、GIS的数据质量的内容(类型)
1、GIS数据质量的基本内容
1)位置(几何)精度:如数学基础、平面精度、高程精度等,用以描述
几何数据的误差。
2) 属性精度:如要素分类的正确性、属性编码的正确性、注记的正确性
等,用以反映属性数据的质量。
3) 逻辑一致性:如多边形的闭合精度、结点匹配精度、拓扑关系的正确
性等,由几何或属性误差也会引起逻辑误差。
4) 完备性:如数据分类的完备性、实体类型的完备性、属性数据的完备
性、注记的完整性,数据层完整性,检验完整性等。
5) 现势性:如数据的采集时间、数据的更新时间等。
误差的具体来源
阶段

误差来源


数据采集

实测误差,地图制图误差(制作地图的每一过程都有误差),航测遥感数据分析误差(获取、判读、转换、人工判读(识别要素)误差)


数据输入

数字化过程中操作员和设备造成的误差,某些地理属性没有明显边界引起的误差(地类界)


数据存贮

数字存贮有效位不能满足(由计算机字长引起,单精度、双精度类型)
空间精度不能满足


数据操作

类别间的不明确、边界误差(不规则数据分类方法引起)
多层数据叠加误差
多边形叠加产生的裂缝(无意义多边形)
各种内插引起的误差


数据输出

比例尺误差、输出设备误差、媒质不稳定(如图纸伸缩)


成果使用

用户错误理解信息、不正确使用信息

4、误差传播

误差传播可分为三类:
1)代数(算术)关系
    如差、倍数、线性关系,有一套成熟的经典测量误差理论处理。
2)逻辑关系
a、布尔逻辑关系:GIS中存在大量的逻辑运算,如 叠置分析。
b、不精确推理关系:
     如专家系统中的不精确推理。
   逻辑关系下的误差传播正处于研究中,需要借用信息论,模糊数学、人工智能、专家系统等学科有望解决。
二、 GIS数据质量的评价方法
1、直接评价法
1)用计算机程序自动检测
    某些类型的错误可以用计算机软件自动发现,数据中不符合要求的数据项的百分率或平均质量等级也可由计算机软件算出。此外,还可检测文件格式是否符合规范、编码是否正确、数据是否超出范围等。
2)随机抽样检测
      在确定抽样方案时,应考虑数据的空间相关性。
2、间接评价法-----(地理相关法和元数据法)
     指通过外部知识或信息进行推理来确定空间数据的质量的方法。用于推理的外部知识或信息如用途、数据历史记录、数据源的质量、数据生产的方法、误差传递模型等。
3、非定量描述法
      通过对数据质量的各组成部分的评价结果进行的综合分析来确定数据的总体质量的方法。

三、数字化的误差评价和质量控制
1、评价数字化误差的方法
1)自动回归法
      由于跟踪数字化不仅是一个随机序列,而且是一个时间序列,因此可用数理统计中的时间序列分析法来确定数字化的误差。
2)ε-Band法
       该方法适用于任何类型的GIS数据,关键是如何给出合理的ε值。

3)对比法
     把数字化后的数据,用绘图机绘出,与原图叠合,选择明显地物点进行量测,以确定误差。除了几何精度外,属性精度、完整性、逻辑一致性等也可用对比法进行对照检查。
2、数字化过程中的质量控制
1)数字化预处理工作
包括对原始地图、表格等的整理、清绘。
2)数字化设备的选用
     根据手扶数字化仪、扫描仪等设备的分辨率和精度等有关参数的进行挑选,这些参数不应低于设计的数据精度要求。
3)数字化对点精度(准确性)
   数字化时数据采集点与原始点的重合程度,一般要求对点误差小于0.1mm。
4)数字化限差
     包括:采点密度(0.2mm)、接边误差(0.02mm)、接合距离(0.02mm)、悬挂距离(0.007mm)等。
5)数据的精度检查
   输出图与原始图之间的点位误差,一般要求对直线地物和独立地物,误差小于0.2mm,对曲线地物和水系,误差小于0.3mm,对边界模糊的要素应小于0.5mm。
四、数据处理中数据质量的评价
1、数字高程模型(DEM)的精度
主要受原始资料的精度(采样密度、测量误差、地形类别、控制点等)和内插的精度(内插方法、地形类型、原始数据的密度等)的影响。
   DEM的内插精度主要受原始采样点的采样密度的影响,与不同的插值方法的关系不很大。但在DEM精度评定的标准方面、地貌逼真度方面、DEM的粗差探测等方面仍没有得到圆满的解决。
   目前,对DEM精度的评价常采用原始等高线与再生等高线叠合评价的方法。
2、矢量数据栅格化的误差
包括属性误差和几何误差两种。
      在矢量数据转换为栅格数据后,栅格数据中的每个象元只含有一个属性数据值,它是象元内多种属性的一种概括。象元越大,属性误差越大。
   几何误差是指在矢量数据转换成栅格数据后所引起的位置的误差,以及由位置误差引起的长度、面积、拓扑匹配等的误差。几何误差的大小与象元的大小成正比。
   其中矢量数据表示的多边形网用象元逼近时会产生较严重的拓扑匹配问题。
误差分析的一种方法:假设存在一幅理想的矢量地图,图上不同属性的制图单元由很细的线分开;对理想地图进行观测采样得到一幅具有规则格网的栅格地图,把这两幅图进行叠置比较。
3、多边形叠置产生的误差
多边形叠置误差计算的思路是,先计算单层图的误差,再计算叠置图的误差。会产生拓扑匹配误差、几何误差和属性误差。
1)拓扑匹配误差
        多边形叠置往往是不同类型的地图、不同的图层,甚至是不同比例尺的地图进行叠置,因此,同一条边界线往往是不同的数据,这样在叠置时必然会出现一系列无意义的多边形。所叠置的多边形的边界越精确,越容易产生无意义的多边形。这就是拓扑匹配误差。
    多边形叠置所形成的多边形的数量与原多边形边界的复杂程度有关。如果多边形之间具有统计独立性时,产生中等数量的多边形;如果是高度相关的,则产生大量无意义的多边形。-----需要合并无意义的多边形
合并无意义的多边形的方法:
A、用人机交互的方法把无意义的多边形合并到大多边形中;

B、根据无意义多边形的临界值,自动合并到大多边形中;
C、用拟合后的新边界进行合并。

相关话题/地理信息系统