浅议信息化测绘体系中的建立-论文网
所属栏目:信息安全论文
发布时间:2011-03-09 09:19:13 更新时间:2011-03-09 09:46:12
浅议信息化测绘体系中的建立
刘念1,秦广田2 毛腊梅3
1.长安大学,2.国家测绘局第一地形测量队,3.西安地图出版社,陕西,西安,710054
摘要:本文首先介绍了的概况,分析了要满足测绘信息化的要求,测绘行业的地理信息数据采集、加工、交易中还存在的问题,指出数据仓库和数据集市的症结,最后提出了“数据超市”的数据管理模式,进一步强调了标准地理信息数据类型的必要性。
关键词:信息化测绘 数据超市 地理空间信息
1、引言.
当今世界已进入信息时代,信息已经广泛深入应用到政府、企事业单位、社会公众的重大决策、日常工作以至生活之中,信息产业已经成为国民经济的主要支柱性产业之一。
信息作为信息的重要组成部分,由于其基础性、时空性、可视性,更是得到了政府、企业的高度重视,自上世纪90年代美国先后提出“信息高速公路”、“空间数据基础设施(SDI)”、“数字地球”的概念后,大大促进了现代地理信息产业的兴起和迅猛发展,国际上传统的测绘正经历着一场以地图生产为主转向以地理信息综合服务为主的重大变革。2004年,英国《自然》杂志明确将地理空间信息技术和纳米技术、生物技术一起列为21世纪最具发展前景的三大技术之一,充分体现了地理空间信息在未来世界发展中的重要地位及其价值。
经过“九五”、“十五”期间的努力,我国测绘已经基本完成了从“模拟化测绘”向“数字化测绘”的转变。然而,从总体上说,我国的地理信息资源明显不足,“数字鸿沟”“信息孤岛”大量存在,地理信息服务水平普遍不高,难以满足政府、企事业单位、社会公众对地理信息的需求。因此,加快地理信息资源建设和地理空间数据整合,加强地理信息标准化,建立广泛的空间信息交换网络,夯实“地理空间信息基础设施”,实现全社会对地理空间信息的充分共享和利用,即走信息化测绘发展之路,不但是时代的要求,也是测绘发展的必然。【1】
早在2003年,胡锦涛总书记在中央人口资源环境工作座谈会上就明确指示要“推进数字中国地理空间框架建设,加快信息化测绘体系建设,提高测绘保障服务能力。”温家宝总理也提出,“要加快构建数字中国地理空间框架,积极促进国民经济和社会信息化,全面提高测绘保障能力和服务水平。”国务院前副总理曾培炎也强调,“信息化测绘体系是当代测绘发展进步的标志。测绘事业发展要走以信息化测绘体系建设为核心的道路。”
笔者认为,要进行信息化测绘体系的建设,除了要解决“数据采集”、“数据生产”之外,需要解决的一个重要问题就是“数据交换”。只有解决了这个问题,数据采集和数据生产才会发生实际的效应。通过数据交换,才能让各行业充分享受信息化测绘带来的便捷,进而为我国的经济建设作出贡献。那么,要解决数据交换的问题,首先就要考虑数据的存储模式。
2、数据存储的现状
随着航天航空、全球定位系统(GPS)、三维激光扫描等数据采集技术的发展,各种比例尺地形图和专题地图的出版发行,测绘行业的计算机系统每年都会产生海量的数据。如何有效的对这些海量的、繁杂的、各种结构、各种类型的数据进行有效管理,使不同需求的用户可以方便地访问、查询,甚至利用这些数据进行辅助决策,从而有效地为社会各行业提供测绘保障,目前已经成为测绘行业面临着的困境。
建立数据仓库(Data Warehouse)可以把采集到的各种数据转化为有用的、可信赖的信息,有效地支持商业决策。
目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改[2]。
在信息时代,对测绘行业来讲,要求对历史数据可以进行修改或更新,但是不能对其进行删除或销毁。当然,在修改或更新以前,需要对历史数据进行备份,这样,经过对历史数据和更新数据进行比较、分析,才能对有关地理信息产品或者对新建的项目进行科学的评价。所以,测绘行业所存储的数据量会越来越越大,每年甚至以TB级的速度增长。
测绘行业把地面上的人工的、天然的所有元素分为九大类,即测量控制点、居民地、工矿建(构)筑物、交通及附属设施、管线及附属设施、水系及附属设施、境界、植被、地貌和土质。测绘行业在建设地理信息数据库的时候,是按照这九大类分别采集、编辑、成图、入库的。目前,测绘行业提供给用户的数据是按照图幅进行提供的。这就是说,这九大类数据都包含在图幅中,如果某一个用户只需要某一区域内的一类或几类数据,那么,即使不需要其它类别的数据,也必须支付这几类数据的费用。这就相当于把不同类别的东西放在一个集装箱内,在销售时整箱卖,不能零售。这中交换模式对用户来讲显然是不合适的。我们能不能建立一套系统就像超市一样,用户需要哪些数据,我们就提供给用户哪些数据呢?也就是说我们能不能面向用户来建设地理信息的数据市场呢?这样,即使用户只需要某一类数据中的个别数据,我们也能照单供应。这就引出了测绘行业的数据是建设成按照集装箱式交易的“数据仓库”呢,还是建设成为可以进行地理信息数据零售的“数据集市”?拟或是建设成为不仅可以零售,而且还可以进行数据交换的“数据超市”?这就牵扯到测绘行业的数据存储模式和管理模式的问题。
3、数据仓库和数据集市的争论
要对每年以TB级增长的数据进行有效管理,必须建立适合测绘行业特点的数据存储仓库,同时也可以使用户方便地使用仓库中的各种数据,当然,保密数据的使用是要经过特别允许的。
说起仓库,大家自然而然地会想起“一所大大的房子,成排的高大货架,合理的出入路线,是一种集中存储货物的地方,一般顾客是不来参观访问的。”而集市就使人联想到空旷的场地,川流不息,大小商户摆出摊子,卖各种各样的商品,是让顾客来消费的地方。
如果狭义的理解这个定义,数据仓库就是提供存储的,提供一种面向数据管理的服务,不面向最终用户;而数据集市是提供数据零售的,是面向分析应用、面向最终用户的,但是不提供存储。这样,在测绘领域就出现了建设数据仓库还是建设数据集市的争论。
大家都知道,测绘行业的数据需要零售给其他用户,用户可以直接访问,并最终使用这些测绘数据。这一点就有点像数据集市了。可是,众所周知,测绘行业不单是给用户提供测绘数据,还承担着测绘数据的存储任务。说到数据存储,大家自然而然就想到了计算机上的存储介质,它的存储单位是“KB、MB、GB、TB”等。而测绘行业的存储单位是按照“幅”来计算的,并不考虑每幅图的数据到底能占多大的存储空间,从这一点上看,又有点像只考虑存储集装箱的数量、而并不考虑集装箱内到底装多少货物的集装箱式数据仓库了。
一般来讲,测绘行业除了进行合法的采集地理信息数据外,还要对这些采集来的数据进行加工、生产,最终形成通用的地理信息数据产品。从这一点来看,测绘行业更像是一座数据加工厂了。这座“加工厂”里有“原料仓库”——用来存储采集的各种数据;有“数据加工车间”——用来对采集来的数据进行分析、处理、加工、生产,从而生产出各种各样的测绘产品;还有“产品仓库”,用来按照比例尺、分辨率分门别类地存储上工序生产出来的测绘产品;另外,这座工厂还需要一个对外销售的“交易市场”,这样才能把采集来的数据和生产出来的测绘产品销售出去,以实现使用价值和价值的交换和分离。
现在, “数据加工厂”的生产模式在测绘行业已经形成,也可以进行各种各样的数据处理、加工。但是,这些数据加工和处理只是建立在面向用户的基础之上的。也就是说,用户(包括政府)要求什么,我们根据这种要求进行数据的采集、加工和生产。这就相当于工厂的“订单式”生产,虽然针对个别用户来讲,是一种快速的获取有用数据的途径。但是从大的方面来讲,还不能加工成各种各样的地理信息数据产品,还不能做到及时甚至超前地满足各行各业对地理信息数据产品的要求。
目前,在测绘行业,所有的数据都是按照标准进行分幅存储的,这在模拟测绘时代是必不可少的存储手段,在计算机存储空间不够大时,这个手段也还能起到条理清晰、易于查询的作用。可是,随着计算机技术的快速发展,电子存储空间快速增大。就拿一个硬盘空间来讲,在2000年前后,一个6.3GB的硬盘就已经让人羡慕不已了,现在,一个硬盘空间动辄就500GB,甚至1TB、2TB,况且还出现了磁盘柜,空间更是要多大就有多大。过去,我们连把全国的1:5万地形图数据存储到计算机里都不敢想,可是现在,连全国的1:5千地形图数据都可以放到一个小小的硬盘或硬盘柜里了;如果我们愿意,甚至连全国城镇的1:500地形图的数据都可以存储在一个硬盘柜里。
另外,计算机的处理速度也较以前有了大幅度的提高,不管是CPU的处理速度,还是显卡的处理速度,都是奔腾级的计算机无可比拟的。
几乎无限量的存储空间,加上越来越快的计算机处理速度,就要求我们适应这个进步,改变我们的工作方法,以充分利用现代计算机技术发展的成果。如果还是按照“幅”来存储地理信息数据,显然已经没有必要了。这就要求我们来探索以什么样的数据格式来存储地理信息数据,才能方便地进行数据交易?
4、数据管理的新模式——数据超市
要想开发面向广大用户的地理信息数据应用技术,首先要解决的是如何进行地理信息数据的存储问题。在文献3中,提到的空间数据仓库技术,笔者认为值得推广。
空间数据仓库是在数据仓库的基础上,引入空间维数据,根据主题从不同的GIS应用系统中截取从瞬态到区段直到全球地球系统的不同规模时空尺度上的信息,从而为当今的地学研究以及有关环境资源政策的制定提供最好的信息服务。空间数据仓库主要具有以下功能:(1)它可以兼容各种GIS系统的数据;(2)可对用户感兴趣的数据进行有效提取;(3)为了优化空间数据仓库的分析性能,需要将现有的GIS数据进行适当的变换;(4)可以按照时间序列调用数据,以便进行变化和趋势分析(5)可以按照空间序列调用数据,以便进行空间变化分析【3】。
根据以上特征,我们在采集地理信息数据时,要按照测量控制点、居民地、工矿建(构)筑物、交通及附属设施、管线及附属设施、水系及附属设施、境界、植被、地貌和土质等的分类进行数据采集,并进行归类存放。这样,当授权用户需要某一地区、某一时间的某一类数据时,就可以很方便进行针对性地提取,进而进行历史演变描述、现实情况分析,甚至可以进行将来发展态势预测。而未授权用户只能浏览公开的、不涉密的符号化信息,或是经过处理的影像信息,但是不能对这些信息进行提取。
另外,在双方自愿的前提下,测绘部门也可以和其它能够进行数据采集的部门合作,进行更新数据交换,以便测绘部门对地理信息进行快速更新。城市的地理信息更新的快捷方法可采用德国的方法,就是利用“测绘自愿者”自愿采集变化部分的地理坐标、属性信息,有偿提供给测绘部门;或者直接提供变化所在的位置信息,测绘部门进行快速变化数据采集,然后进行快速更新。
这样,数据存储采用空间数据仓库,数据交易采用交换、零售的灵活手段,数据更新采用交换或“测绘自愿者”提供信息的方法,三位一体,可以保证我们的地理信息数据保持长新。这种数据管理模式,不但是数据存储,也不仅是数据交易,它还有数据更新的功能,所以笔者称之为“数据超市”。
如果要和其它数据采集部门进行数据交换,就涉及到一个数据类型的问题。
5、数据交换的基础——标准的数据类型
在解决了地理信息数据的存储、更新模式以后,接着就要考虑“数据交换”的问题了。虽然,为了采集和生产地理信息数据,在测绘行业有各种规范、图式等强制性、规则性文件,可是不同比例尺的图式及数据规定之间却风马牛不相及,各有各的图式符号,各有各的数据规定,并且这些符号和数据编码都有很大差异。这就导致大比例尺、中比例尺、小比例尺地形数据之间很难自动实现共享和互通,对不同比例尺的地图数据的传递带来了很大的困难。
另外,不同行业的地理信息数据也有不同的图式符号和不同的地形要素代码,例如:铁路行业有自己的图式、国土部门有自己的图式,等等。这就对不同行业之间的数据共享带来了无法逾越的障碍。
如果我们试图建设中国的地理信息数据市场,满足各行各业对地理信息数据交换的要求,那么针对每一类数据(包括自己生产的和不同部门之间交换的)都应有一个统一的名称、符号和要素代码。有了标准的数据类型,不同的用户就可以用统一的要素代码(或名称)查询、使用自己感兴趣的数据。例如:林业部门可以查询和使用道路信息、林地覆盖等信息;交通部门关心的是道路、桥梁、涵洞等信息;水利部门可能用到河流、湖泊、渠道、农田等信息。这些信息只有统一了名称和要素代码,才能在不同用户互相交流。这就相当于不同国家的人,在交流时要使用相同的语言一样。
6、结束语
利用“数据超市”管理模式,不但可以使测绘行业为政府部门提供快速、高效的服务,也可以使测绘行业走向普通百姓,是新一代GIS的发展方向。利用空间数据仓库功能,利用和国土、交通、水利等部门的数据交换,以及“测绘自愿者”的帮助,“数据超市”一定能提供给包括政府部门和普通百姓在内的各类用户满意的服务。
参考文献
1、浙江省测绘局,《浙江省信息化测绘体系建设发展战略研究报告》,2009年。
2、唐世渭,裴健. 数据仓库中的联机分析处理技术与元数据机制. 《中国金融电脑》,1998.5。
3、“数字地球”中GIS的数据仓库技术与应用,2008.12,。