地理元数据技术系统的设计与实现

2024-10-17

地理元数据技术系统的设计与实现（共8篇）

1.地理元数据技术系统的设计与实现篇一

基于基础地理信息数据库的制图设计与实现

辽宁省测绘局于开始正式启动辽宁省基础地理信息数据库建设工程,该建设工程的目标之一是实现了图库一体化功能.本文详细介绍了基于辽宁省基础地理信息数据库的`制图设计与实现.

作者：肖文芳 Xiao Wenfang 作者单位：辽宁省基础地理信息中心,辽宁,沈阳,110034刊名：现代测绘英文刊名：MODERN SURVEYING AND MAPPING年，卷(期)：32(1)分类号：P208关键词：基础地理信息数据库制图

2.地理元数据技术系统的设计与实现篇二

随着用户需求的改变和软件运行环境的变化,软件系统需要不断演化以适应这种新的变化,如何实现软件演化是软件工程研究领域的一个热点问题[1,2]。软件工程从许多方面,例如OOP、OOA/OOD、各种软件过程(RUP、XP)和方法等对此进行了研究。这些技术运用得当可以构建出可用、可靠、稳定的系统。但是,当需求发生变化时,现代软件存在着如下不足:传统软件主要采取了“黑箱”的实现机制,即对外部应用屏蔽了内部具体实现细节,这种机制使得外部应用无法获取系统的内部结构和状态行为,从而无法根据相关需求来动态调整系统应用级的结构行为,这样使得相关应用缺乏对变化环境的适应性[3,4,5]。

要解决上述问题,软件系统应具有如下特点:系统应具有较为开放的结构,使得外界能获悉系统内部相关成分,从而能根据外部环境变化对系统相应部分的结构行为作一定调整与改变;系统应具有动态重配置的能力,即能在运行过程中进行动态调整、定制和改变自身相关的结构行为,且不影响系统整体的运行[4]。

本文将元数据和反射引入基于关系数据库的Web系统设计中,通过对系统业务信息的具体化(reification),使得外部能获取系统自身结构、行为的自描述(self-representation)元数据,从而实现系统内部的开放;系统的自描述与系统结构行为是因果相连(causally connected)的,通过对元数据的调整与改变,可实现对系统特定部分和功能的反射,使得系统具有动态重配置的能力[6]。

1 相关研究

20世纪80年代后期,随着对反射式程序设计语言、反射式操作系统研究的深入,对反射系统也形成了一个较为一致的认识:反射系统可被认为是一种可通过因果相连的方式来反演自身的计算系统,反射则是反射系统的行为表示[7,8]。反射系统可以形式化地表示成二元组S=〈PL,TL〉,其中S为计算系统,L为系统S用以表示问题域所用的语言,PL为语言L的处理器,TL为PL的状态,RS为S在TL中基于L语言的表示,S与RS的关系为:S包含RS,且S和RS之间是因果相连的[9]。

在反射系统实现中,一般采用“关注分离”的原则,即系统分为基层(Base Level)和元层(Meta Level)。基层用于对具体问题域的抽象,元层则是对基层及系统内部的表示。元对象封装基层对象的元数据,描述基层对象的结构和行为,并动态地管理基层对象。反射是指通过获取元数据来观察和调整系统内部及基层相关部分结构行为的过程。

在利用元数据和反射技术实现软件系统的研究中,文献[10]介绍了在面向对象编程语言中使用反射和元编程需要遵循的3个重要原则。给出了使用元数据和反射的基本原理和设计规则,文献[11]通过使用基于XML描述的元数据和某些语言的自省机制来连接构件和基本框架,目的是构建可扩展的系统,其元数据描述重点在系统功能,实现功能的灵活扩展。文献[12]提出了一种基于构件的系统运行时变化和恢复的软件架构。通过完整描述系统运行时的状态和行为,使用构件框架的反射能力实现系统的运行时恢复。本文使用元数据描述系统的结构信息,利用存储过程来表达系统行为。元数据存储在关系数据库中,存储过程作为一个命名的独立模块可以被动态配置和调用。元数据和存储过程可以通过一个单独的配置系统动态管理,通过运行时反射机制实现系统的动态重配置。与文献[10]相比,本文方法不仅能实现功能扩展,还能管理系统的结构;与文献[11]相比,本文侧重点在于系统的动态重配置。

2 基于元数据和反射的动态重配置

基于关系数据库的Web系统是本文动态重配置方法研究的对象。很多关系数据库中都提供命名的批处理代码段,例如SQL Server数据库中的存储过程(Stored Procedure)、Oracle中的过程(Procedure)。这种命名的批处理代码段编写完成以后注册到服务器,通过名字可以反复调用多次,而且每个代码段可以有上百条SQL代码,这上百条代码在调用时只需要一条执行语句即可,不需要向网络发送上百条代码,能有效降低系统网络开销。批处理代码段可以包含若干代码,因此可以把系统的业务逻辑封装其中,使用时按名称调用即可。本文设计方法基于SQL Server数据库,把系统的业务逻辑封装到存储过程中。当需求变化时,用户可以通过配置元数据和存储过程,动态修改基层对象,实现软件运行时动态重配置。

本文方法使用关系数据库存放元数据,所以要考虑元数据的完整性约束处理。

2.1 元层设计

2.1.1 元对象

元对象主要包括:数据表对象、视图对象、数据集对象、字段对象。具体如下:

(1)数据表对象描述关系数据库表,其定义包含名称、类别(所属的业务领域)。

(2)字段对象描述字段的详细信息和该字段基层的结构信息,例如基层程序的显示名称、显示长度、使用控件类型等。其定义主要包括字段名称、所属表、字段中文名称、约束类型、字段长度、显示次序、显示控件、计算方式、最小值、最大值。字段属于基本表,所以在图1中,表与字段关系为组合关系,并且每个数据表至少有1个字段。

(3)视图对象描述关系数据库中的视图。在关系数据库中,视图的字段分成两类:一类是构成视图的基表字段,另一类是由基表字段推导出的附加字段。因此视图对象在图1的设计中涉及到3个类:视图类、视图父表字段类、视图附加字段类。每个视图至少包括1个父表字段,有0到多个附加字段,其关系如图1所示。视图对象定义主要包括视图名称、视图中文名称、视图所属业务领域;视图附加字段定义包括字段名称,显示顺序、中文标题、类型;父表视图字段定义包括父表名称、字段名称、显示顺序。

(4)数据集对象是一种特殊的元对象。它和数据库中的存储过程一一对应,系统通过存储过程封装业务逻辑。例如在界面中显示个人所得税页面时,个人所得税的计算方法就可以通过存储过程存放到数据库中,当计算方法改变时,只需要修改存储过程即可实现业务规则修改。每个返回结果集存储过程包含的字段分为两类:一类是来自于基本表的字段,另一类为由基本表推导得到的字段。这两类字段分别用数据集附加字段和父表数据集字段表示。其中父表数据集字段的字段定义来自于父表定义。数据集对象在图1中主要包括3个类:数据集、数据集附加字段、父表数据集字段。数据集定义包括:数据集名称、数据集中文名称、数据集分类(所属业务领域);数据集附加字段定义包括:字段名称、中文名称、显示顺序、类型;数据集父表字段定义包括:字段名称和显示顺序。

2.1.2 三种元对象操作类和数据获取方法

对基层对象和元对象的操纵控制,主要是由反射模式的内省和调节功能来保证[6]。本文对表和视图的管理通过类TableDescription完成;字段管理通过类FieldDescription和类FieldDescriptionList来处理;数据集的管理通过类DatasetDescription来处理。其主要属性和方法如图2~图5所示。

为了更简明清楚定义操作过程,作如下规定:①对象T属于TableDescription;②对象F属于FieldDescription;③对象V属于TableDescription;④对象D属于DatasetDescription;⑤对象FL属于FieldDescriptionList。

(1)过程1:根据表名或视图名取得数据。

①将表名或视图名传递给T.TableName,取得表描述信息;

②使用FL.GetFieldList(表名称),取得字段列表;

③foreach(F in FL.GetFieldList(表名称))

组合F成物理字段列表;

转到字段处理子程序;

④检索出业务数据,并绑定到页面对象。

(2)过程2:字段处理子程序。

①if字段为自增(F.IsIdentity)then

字段设置为只读;

②if字段有外键引用(F.FkField!=null)then

将本字段呈现为外键关联出的值(例如主表中性别编码,在基层将呈现为外键表中数据男或者女);

③if字段允许为空(F.IsNull==true)then

对字段不作非空验证;

④if字段有最大或最小值(F.Min!=null or F.Max!=null)then对字段作范围验证;

⑤转数据完整性处理。

(3)过程3:根据存储过程名称和参数取得数据的过程。

①将存储过程名和存储过程参数传递给D.ProName和D.ProParams,取得数据集描述信息;

②使用FL.GetFieldList(存储过程名称),取得字段列表;

③foreach(F in FL.GetFieldList(存储过程名称))

组合F成物理字段列表;

转到字段处理子程序;

④检索出业务数据,并绑定到页面对象。

字段元数据存放在关系数据库当中,须考虑数据实体完整性和参照完整性。对于实体完整性,主要考虑主键约束;参照完整性在本文中分成3类:标识关系、非标识强制关系、非标识非强制关系。

(4)过程4:完整性控制。

①if F.ConstraintsType==主键then

加入基层类主键列表(加入主键列表后,基层类在数据更新、删除等操作的过程中,会按照主键列表构造where字句进行更新、删除操作);

②if F.ConstraintsType==标识约束then

Case增加then基层对象检测字段非空和外键约束;

Case修改then基层对象检测字段非空和外键约束;

Case删除then基层对象直接删除记录。

③if F.ConstraintsType==非标识强制约束then

Case增加then基层对象检测字段非空和外键约束;

Case修改then基层对象检测字段非空和外键约束;

Case删除then基层对象直接删除记录。

④if F.ConstraintsType==非标识非强制约束then

Case增加then基层对象检测外键约束;

Case修改then基层对象检测外键约束;

Case删除then基层对象直接删除记录。

2.2 软件运行和重配置过程

软件运行和软件动态配置过程如图6所示。配置好元数据后,软件会按照用户需求显示和按业务规则运行(图中步骤1)。基层控件接受用户操作要求并把需求具体化为对应的元数据提交给元对象(图中步骤2、3),元对象操作元数据并接收操作返回的信息(图中步骤4、5)。元对象会将数据库中的数据按照规则组织业务数据反馈给基层对象(图中步骤6),基层对象把信息反馈给用户(图中步骤7、8),这是一次完整的交互。当需求发生变化时,如果用户期望软件适应新需求,则可以打开元数据配置页面(图中步骤9),执行元数据配置操作,通过该操作修改元数据信息(图中步骤10、11、12)。当用户修改元数据后,重新进入功能界面就可以使用演化后符合新需求的系统(图中步骤13)。

3 运行时反射过程与实例

图7为一个运行时反射实例,其开发环境为VS2005和Sqlserver2005。两条虚线之间为元数据操作,虚线之外为基层界面。

在软件的基层界面中第一列名称显示为“教师名称”,根据前文过程1,显示其过程为:

①将表名“Teacher”传递给T.TableName,取得表描述信息;

②使用FL.GetFieldList(“Teacher”),取得字段列表;

③foreach(F in FL.GetFieldList(“Teacher”))

组合F成物理字段列表;此时F中教师名称的物理字段为“tchrName”,即F.FieldName=“tchrName”),F.FieldCTitle为“教师名称”。

转过程2:对于F.FieldName=“tchrName”,为普通字段,因此自增、外键、非空、范围、数据完整性约束等验证都为false。

④检索出业务数据,并绑定到页面对象。

在运行过程中用户可以在3.2节第2步的元数据配置页面修改该列的元数据,例如修改成图中的“教师姓名”,按照上文所述的反射流程,修改元数据后,对应的基层对象的软件界面也会随之变化,如图3中第3步所示结果。

4 结语

本文提出了基于元数据和反射的Web系统重配置设计方法,详细描述了元对象的结构和操作元对象的方法,介绍了应对需求变化的动态重配置过程,并给出了一个简单示例。本文使用的方法能够部分解决需求变化的问题,但是本方法只适用于基于关系数据库的Web程序,其适用范围的局限性限制了应用价值,下一步应将其扩展到互联网软件上。例如,当利用Web服务作为构成系统的功能单元时,如何描述系统的结构,采用什么方式描述系统行为,从而使系统具有动态演化的能力。

参考文献

[1]TOM MENS,JEFF MAGEE,BERNHARD RUMPE.Evolving software architecture descriptions of critical systems[J].IEEE Computer,2010,43(5):42-48.

[2]WANG YING,WANG LIFU.Research about model and ripple effect analysis of software architecture evolution[J].Acta Electronica Sinica,2005,33(8):1381-1386.

[3]HU HAI-YANG,MA XIAO-XING,TAO XIAN-PING,et al.Research and advance of reflective middleware[J].Chinese Journal of Computers,2005,28(9):91-96.

[4]COULSON G,BLAIR G S,CLARKE M,et al.The design of a highly configurable and reconfigurable middleware platform[J].Journal of ACM Distributed Computing,2002,1(2):109-126.

[5]SCHMIDT DC,CLEELAND C.Applying apattern language develop extensible ORB middleware[M].New York:Cambridge University Press,2001:393-438.

[6]National Information Standards Organization.Understanding metadata[EB/OL].http://www.niso.org/publications/press/Underst-andingMetadata.pdf.

[7]YASUHIKO Y.The apertos reflective operating system:the concept and its implementation[C].Proceedings of the ACMOOPSLA'92,1992:414-434.

[8]PATTIE M.Concepts and experiments in computational reflection[J].ACM SIGPLAN Notices,1987,22(12):147-155.

[9]HIDEAKI O.A study on multi-model reflection framework in distributed environments[D].Department of Computer Science,Keio University,1995.

[10]GILAD BRACHA,DAVID UNGAR.Mirrors:design principles for meta-level facilities of object-oriented programming languages[C].In:Proceedings of the OOPSLA'04,Vancouver,British Columbia,Canada,2004,331-344.

[11]OU JIN-LIANG,JIN MAO-ZHONG.A method of metadata modeling to construct extensible and flexible system[J].Journal of Computer Science,2005,32(7:)214-217.

3.地理元数据技术系统的设计与实现篇三

【关键词】地理信息系统;电力网络;WEB

1.总体结构

1.1系统体系结构

系统网络结构图

1.2数据流程的内容

其它系统、中心服务器、客户端、客户端、客户端、电力网格、电网属性数据库、城市底图、地名库。

2.技术方案

2.1海量图库高效管理

系统地图库以图幅为单位来管理，具有强大的地图无缝拼接、管理、显示、漫游和灵活方便的跨图幅检索能力，可管理多达数千幅地图。系统采用了先进的索引技术，地图库文件只记录数据索引，保证整个地图库方便的更新和快速打开显示。

同时，系统还提供了强大的地理图形录入和编辑功能。

2.2大型网络协同工作能力

系统提供多任务、多用户的工作环境，空间数据和属性数据存放在大型关系数据库中，实现了数据共享。具备安全的系统登录、访问权限设置。允许多人同时对系统进行访问，大大提高企业的生产效率。

2.3电网模型的建立

系统首先要解决的问题是如何用GIS建立电网模型，针对这个问题，可以有两种解决方案：一种是将架空线、杆塔作为点线文件处理，两者之间除了坐标联系外，再无其它联系。这种方式只能作表层的管理，本系统中我们不采用这种方案。第二种方案是，用网文件表述电网，能够反映出设备之间的连接关系，开关的通断状态，便于实现各种电网分析和今后各种功能的扩展。从长远考虑，为了真正解决电力企业的问题，本系统选用第二种方案

电网（网文件）标注图(点、线文件) 地理背景电子地图

2.4两套坐标系统的实现

具有地理背景的线路走向图模型已经建立起来了，但实际应用中，有些电力部门如调度部门并不关心实际的线路走向，更关心电网的连接关系，这种连接关系反映在系统图或一次结线图中。电力用户的需求就是把线路走向图与一次结线图结合起来，并维护他们之间的对应关系。我们把这种独特的描述方式称为两套坐标系统，两套坐标系统的采用使GIS系统的模型变为：

主电网（wn文件）主标注图辅电网(wn) 辅标注图(wt) 地理背景电子地图

上图中主电网为线路走向图，辅电网为一次结线图，辅电网不带地理背景。

两套坐标系统最关键的问题是保证元素的严格对应关系，系统在每种元素的属性中添加一个对应字段，用于指向另一套坐标中的对应图元，在添加、删除、改变拓扑关系的编辑操作时，系统自动进行另一套坐标系统的维护。

为了保证属性的一致，两套图形共用主电网的属性库，利用一个属性库，才可以真正保持数据的一致性。

2.5开闭所、分接箱、变电站等设备的模型设计

在电网中，开闭所等设备是比较特殊的一类设备，他们本身是一个设备点，其本身所具有的属性是人们所关心的，同时它们内部又包括开关等设备，这些内部设备之间的连接关系也是人们关心的，并且真正对电网分析起作用。底层平台在这方面提供了强有力地支持，在WN网文件中进行扩展，开发出嵌入式“井”模型。开闭所作为井设备，打开井设备可查看内部设备的连接关系，系统同时管理井设备和内部设备，并根据用户需要在两种显示状态之间切换。

2.6面向用户的设备库

不同的电力局对所管设备会有不同的要求，并且随着电力数据的完善，系统以后很可能会向高压、低压方向纵深发展，固定不变的设备库显然不能满足用户要求。系统提供的设备库模块，允许用户对设备进行增加、删除、编辑等操作。

设备库集中管理设备，内容包括设备的专业名称（如“杆塔”、“架空线”等）、设备的类型（点状设备还是线状设备）、设备的图形符号（子图号或者线型号）以及设备的台帐属性结构。

2.7台帐数据库以及运行维护数据的管理

设备的属性数据利用WB文件实现，网络版中则转化为SQL Server数据库中的表。文件的属性结构是可以修改的，这样用户就可以自己在实际的使用过程中进行调整。

实际使用中，属性数据又分为台帐数据和运行维护数据。台帐数据与设备是一对一的关系，每一种设备对应一个WB文件。运行维护数据包括检修、故障、缺陷、挂牌等，设备与这些数据是一对多的关系，一种设备可以挂接多个运行维护记录，也可以一个都不挂接。

系统设计出附表库来集中管理运行维护数据，负责检修、故障、缺陷、挂牌等数据库的创建、属性结构编辑以及与设备的挂接。

2.8地名库模糊查询定位

在电网运行期间，不管是事故处理还是规划设计等，快速的定位到某点都将是很常用、也是很重要的手段，试想如果在故障停电几十分钟后还不能找到事故点，那后果将会如何？为了快速准确的定位，本系统提供了多种定位手段，如定位线定位、查询定位、地名库定位功能。对于地名库定位，不仅能定位到一个具体的位置，同时能进行模糊匹配，搜索出所有与输入字段匹配的地名供选择。

2.9开放式数据库结构

根据目前电网工作的实际情况，本系统的数据库采取开放形式，用户可以在具有一定专业知识和管理技术的前提下修改和设置数据库结构，增加、删除数据表，从而可以大大提高系统的可扩充性。

2.10独特的图数互动查询方式

对于查询到的结果，系统提供图数互动的显示方式。选定属性框中的一条记录，对应设备的图形会跳转显示在窗口内，选择一个设备，又可以马上看到其所包含的属性信息。该技术很好地解决了长期以来图形数据与属性数据的分离问题，能够图文并茂、简便直观地将信息传送到用户面前。

3.系统功能模块设计

以地图管理子系统为例阐述系统功能模块设计

3.1地图管理子系统

本系统完成对电子地图的编辑，实现海量图库管理，包括图件矢量化、AutoCAD等多种格式转换、外业调绘成图和误差矫正、图幅无缝拼接、投影变换等功能。

3.2图形输入

提供丰富的矢量图形成图方式：

利用数字化仪输入成图。

利用野外全站仪、电子手簿输入成图。

利用扫描仪数字输入成图。

通过键盘输入点坐标方式。

利用鼠标在图形窗口中定位成图。

可以读入已经存储于文件中的图形、点、线坐标信息并自动成图。

对于多种图形格式文件，及各种GIS软件系统的输出图形文件均可以转换成系统可以接收的格式；同时，系统中的图形也可以通过格式转换为其它软件能接收的格式。

3.3图形编辑

图形编辑是地形图编辑管理模块中最重要、不可缺少的部分，是一个重要的维护管理工具，通过编辑能够改善绘图精度、更新图形内容、丰富图形表现力，实现图形综合，同时对各种图形文件（点、线、区、网等）或整个工程项目的储存、更新、备份；管理着图层和窗口的操作，其主要功能有：

对点、线、区三种图元的各种操作和编辑。

对点、线、区三种图元参数的编辑和统改。

拓扑处理和系统库编辑。

错误检查。

提供各种图形的矢量化功能。

对各种工作区（点、线、区、光栅）和网络的管理。

利用窗口达到交互式图形编辑使图形的编辑、修改、设计、更新更加方便、精确。

提供图形分层的编辑功能。

3.4图形输出

图形输出系统和分析结果输出系统是本系统主要输出手段。图形输出系统主要是读取MAPGIS的各种输出数据，进行版面编辑处理、排版、图形整饰，最终形成各种格式的图形文件，其主要功能有：

地形图的输出。

各种图形文件（点、线、区、网等）的输出。

WINDOWS输出。

POSTSCRIPT输出。

光栅处理输出。

数据转换

MAPGIS数据转换功能为MAPGIS系统和其他GIS系统间架设了一座桥梁，实现了不同系统间的数据转换，从而达到数据资源的共享。本系统主要的数据转换包括：

AUTOCAD格式转换。

ARC／INFO格式转换。

4.地理元数据技术系统的设计与实现篇四

【中文摘要】近十几年来,随着Internet和电子信息技术的迅速发展,电子商务系统、电子政务系统、ERP、MIS等如雨后春笋一般迅速的在各行各业成长起来,很多公司积累的数据越来越庞大。合理的管理这些数据,并能够有效的利用这些复杂而无章的数据,从中发觉有价值的信息成为现今的研究热点。信息化的普及使电信企业得到迅速地发展,越来越多的电信业务、维护、管理数据被保存了下来,然而电信行业的数据管理也面临着与其他行业相同的困境,数据丰富而可用的知识贫乏。在这种背景下,数据仓库技术和经营分析系统技术应运而生了。目前电信企业所使用的基于数据仓库的经营分析系统在一定程度上缓解了这种困境,为电信运营商提供了数据管理和信息展示的功能。由于经营分析系统是建立在省级电信企业的数据仓库基础上的,所以仅对省级电信运营商提供了经营分析和决策支持功能,另外目前多数经营分析系统的数据分析基本依靠OLAP提供的功能,分析能力有限。针对这种情况,本文根据数据集市和数据仓库的关系以及数据集市的灵活性,使用了日渐成熟的数据挖掘技术,提出了基于数据集市和数据挖掘的经营分析系统。系统仍对省级电信运营商建立数据仓库,对各地市运营商和需要数据分析的业务部门建立当前部门的数据集市,为之提供OLAP和数据挖掘功能。另外本文还提出了一个完整的数据挖掘模型的设计,丰富了经营分析系统的功能。本文阐述了

数据集市的设计、数据管理的实现,数据挖掘的功能、设计和实现,提供了一个为电信运营商分析数据、提供信息和知识、辅助经营决策的平台。

【英文摘要】In the past decade, Electronic Commerce System, E-government Affairs System, Enterprise Resource Planning, Management Information System appears rapidly with the development of Internet and electronic information technology, and the amount of many companies` data becomes large.It is really a hotspot nowadays to manage the data probably and discover the valuable information from it.The popularization of informatization benefits the telecommunication enterprise.Larger and larger amount of data of business, operation and support, management has been stored, however the knowledge and information cannot be find easily although the amount of data is large.It is the problem that the telecommunication operating agencies confront as same as which other companies do.Now the Data Warehouse and Business Analysis Technology help the telecommunication operators, and Business Analysis System Based on Data Warehouse established, offered the operators data management, data analysis and information illustration.However it could only respond the request from the province levels` and the system only offers the users

limited options on data analysis, such as OLAP.After the analysis on the telecommunication business and Data Mart, it is believed that a new Business Analysis and Data Mining System which is based on the Data Mart is needed, the new system not only offers its` users, except the OLAP, many advanced data mining tools which supplied by the advanced data mining system based on the data mart, but also has ability to respond the city-level and sub level request, and it could also offer data analysis options to the telecommunication company departments.In the following articles, it describes the details on the design of the data mart, the implement of the data management, the functions, design and the implement of the data mining and knowledge discovery.The new system which is introduced here in this essay offers the telecommunication operating agency a smart platform on data management and decision support.【关键词】数据集市经营分析数据挖掘

【英文关键词】Data MartBusiness AnalysisData Mining

【目录】基于数据集市的电信经营分析系统设计与实现4-5

ABSTRACT5

第一章引言9-13

摘要

1.1 系统的1.3 系统开

1.5 本

开发背景9-10发设计思想10-11

1.2 开发的目的和意义10

1.4 本文研究的主要内容11

文的内容安排11-1313-26

第二章系统理论基础及相关技术

2.1.1 数据挖掘的一

2.2

2.1 数据挖掘技术13-15

般步骤13-142.1.2 数据挖掘技术的分类14-15

2.2.1 数据仓库的特性

数据仓库技术15-2015-16

2.2.2 数据仓库的组成16-192.2.3 数据仓库

2.3.1 数的实现方式19-20据集市的特点2121-2222-23

2.3 数据集市技术20-232.3.2 数据集市中数据的结构

2.3.3 数据集市与数据仓库的区别与联系2.4 联机分析处理技术

23-26

2.4.1 联机分析

2.4.3 OLAP

处理的特点23-242.4.2 OLAP 存储方式24

分析与数据仓库的关系24-26标26-36

第三章系统需求分析及设计目

3.1.1 电信业

3.2 电3.3.1

3.1 电信业务系统介绍26-28

务系统概述26-28信经营分析系统28-29功能需求29-33计目标34-36构设计36-37功能37-383839-4140-41计42-50

3.1.2 电信业务数据特点28

3.3 系统需求分析29-34

33-34

3.3.2 非功能需求3.4 系统设4.1 系统架4.2.1 支撑类

第四章系统概要设计36-424.2 系统功能设计37-384.2.2 分析类功能38

4.2.3 系统管理4.4 数据存储设计

4.4.2 数据粒度第五章系统详细设

5.1.1 账

4.3 数据获取设计38-39

4.4.1 数据主题划分39-404.5 数据访问和接口41-42

5.1 数据集市模型详细设计42-45

务类设计43-44争类设计45计45

5.1.2 业务量类设计44-455.1.4 用户类设计

5.1.3 竞

5.1.5 大客户类设5.3 前台展现详细5.3.2 功能设计

5.2 数据挖掘详细设计45-46

5.3.1 界面设计46-48

设计46-5048-5050-685154-6060-6268-76

第六章基于数据集市的经营分析系统实现6.1 系统体系架构50-546.1.2 软硬件及网络配置51-546.3 系统后台实现60-686.3.2 数据处理层62-687.1 系统界面68-70

6.1.1 逻辑分层6.2 系统前台实现6.3.1 数据获取层第七章系统测试7.2 经营分析系统中的客

7.2.2 7.3

户流失分析70-73用户欠费分析72功能测试73-75出73-747576-7878-79

7.2.1 用户行为分析71-727.2.3 用户流失预警查询72-737.3.1 模型输入参数73

7.3.2 模型输7.4 性能测试

7.3.3 模型准确性验证74-75

7.5 总体测试结论75-768.1 总结76-77参考文献79-82

第八章总结与展望

致谢

5.地理元数据技术系统的设计与实现篇五

小型无人机数据采集与通信系统的设计与实现

小型无人机不论在军事还是民用方面都得到了广泛的应用,其导航、姿态、采集数据信息都需要串口与机载单片机进行通信,并且需要将传感器数据传送至地面控制站进行分析.设计实现由GM8125芯片进行单片机串口的扩展,通过传感器HMR3300和ITRAX02对无人机的姿态、导航数据进行采集,并通过GSM MODEM MC35将数据传送至地面控制站.

作者：龚晓莉李健 GONG XIAOLI LI JIAN 作者单位：内蒙古呼和浩特内蒙古工业大学信息工程学院,010051 刊名：微计算机信息 PKU英文刊名：CONTROL & AUTOMATION 年，卷(期)： 23(34) 分类号：V2792 关键词：串口扩展数据采集电平转化无线通信

6.地理元数据技术系统的设计与实现篇六

随着经济的发展,越来越多的城市开始兴建地铁工程。地铁隧道建造在地质复杂、道路狭窄、地下管线密集、交通繁忙的闹市中心,其安全问题不容忽视。无论在施工期还是在运营期都要对其结构进行变形监测,以确保主体结构和周边环境安全。地铁隧道结构变形监测内容需根据地铁隧道结构设计、国家相关规范和类似工程的变形监测以及当前地铁所处阶段来确定,由规范[1]与文献[2]知,运营期的地铁隧道结构变形监测内容主要包括区间隧道沉降、隧道与地下车站沉降差异、区间隧道水平位移、隧道相对于地下车站水平位移和断面收敛变形等监测。它是一项长期性的工作,其特点是监测项目多、线路长、测点多、测期频和数据量大,给监测数据处理、分析和资料管理带来了繁琐的工作,该项工作目前仍以手工为主,效率较低,不能及时快速地反馈监测信息。

因此,有必要开发一套高效、使用方便的变形监测数据管理系统,实现对监测数据的科学管理及快速分析处理。现阶段国内出现了较多的用于地铁施工期的监测信息管理系统[3-4],这些系统虽然功能比较齐全、运行效率较高,能够很好地满足地铁施工期监测需要,但它主要应用于信息化施工,与运营期地铁隧道结构变形监测无论是在内容还是在目的上都有着很大的区别和局限性。而现在国外研究的多为自动化监测系统[5-6],也不适用于目前国内自动化程度较低的地铁隧道监测。

此外,能够用于运营期并符合当前国内地铁隧道结构监测实际的监测数据管理系统还较为少见。因此,随着国内建成地铁的逐渐增多,开发用于运营期地铁的变形监测数据管理系统变得越来越迫切。为此,根据运营期地铁隧道结构变形监测内容[1-2]和特点,以isualBasic作为开发工具[7],应用先进的数据库管理技术[8],以目前较为流行的Access数据库作为系统数据库,设计和开发了用于运营期地铁隧道变形监测数据管理系统,不仅提高了监测数据处理的效率和可靠性,保证了监测数据反馈的及时性,而且在某城市地铁隧道变形监测中投入应用,取得较好的效果。

1系统的结构

1．1系统数据库结构

变形监测数据库用于存储监测点属性、监测成果等数据信息,是数据管理系统的基础。因此,合理的数据库结构不仅是数据库设计的关键,还有利于系统对数据的管理和高效处理分析。考虑到变形监测成果的特点,系统数据库结构设计应不仅能满足用户的需要,而且能使系统需求的资源最少,同时还要使数据库中数据冗余度尽量小,以达到结构合理、易于维护等目的[8]。为此,根据变形监测内容,系统数据库设计由如下数据表构成。

1)测段名表:包括测段编号和测段名称两个字段。为便于变形监测分析,在监测中将相邻两个车站之间的隧道划分为一测段,并按车站和车站之间的隧道进行编号,测段名称则根据各个车站或者车站之间隧道的名称而定,监测点的测段属性值直接根据其所在测段来取对应的编号值,方便查询。

2)监测点属性表:包括监测点名、测段、车道、具体位置、里程、材料、布设时间、布设单位、当前状况、用情况、备注等。其中车道为监测点所在的左、右道或上、下行线;具体位置指测点所处具体的空间位置,如地面、地下、高架等;当前状况是指目前监测点的完好情况,也就是可用否;使用情况是指监测时是否使用。

3)沉降监测成果表:包括编号、监测点名、高程、测期、监测时间、备注等。为了遵守数据库键的唯一性原则和方便查询,各个测点的每期编号由测期号与监测点名组成,因而表中将不会出现相同记录,保证了键的唯一性[8]。

4)沉降差异点属性表:除了测段为各个车站编号,其余与监测点属性相同。

5)沉降差异监测成果表:与沉降监测成果表相同。

6)水平位移监测成果表:包括编号、监测点名、X坐标、Y坐标、测期、监测时间、备注等,测点的编号设置与沉降监测成果表相同。

7)水平位移差异监测成果表:与水平位移监测成果表相同。

8)断面收敛变形监测成果表:包括编号、监测点名、直径

1、直径

2、测期、监测时间、备注等,测点的编号设置与沉降监测成果表相同。

在以上各表中,第一个字段为主关键字,各字段值的类型与字节宽度均按照实际所需的最佳值确定,考虑到测段名的繁琐和数据库管理操作的方便迅捷,在数据库管理时将测段名表与其他各表进行关联[8]。

1．2 系统的总体结构

根据地铁隧道变形监测的内容与特点,系统由系统设置、预处理、数据库管理、在线帮助和退出5个模块组成,总体结构如图1所示。

2系统的功能及特点

2．1系统的功能

2．1．1系统设置功能

1)参数设置:设置系统所使用数据库的地址,实现对地铁的不同隧道段监测数据库分别进行管理,同时还可设置显示计算成果的小数位数等参数。

2)用户设置:可以添加用户和更改用户登录密码,防止非系统用户进入破坏数据,保证监测数据的安全和系统的正常运行。

2．1．2预处理功能

1)观测资料整理:用户可以通过系统的接口程序实现系统和外业观测电子手簿直接相连,下传原始观测资料,并对其计算处理,得到观测成果数据。

2)粗差检验:对观测成果数据进行检验,剔除不合格数据,保证监测数据的正确可靠,同时将检验后的成果数据录入到数据库中。

3)基准点稳定性检验:检验监测基准点的稳定性,确保监测数据的可靠性。

2．1．3数据库管理功能

1)数据查询:包括属性数据查询和监测成果数据查询。查询属性数据时,可以先对属性数据类别和属性值条件进行选择,同时系统动态搜索出满足条件的测点,然后可根据用户实际需要结合监测成果条件(前后测期、两期沉降量、两期沉降速率等)查询出满足要求的测点属性信息,实现对不同类监测点在不同监测成果条件下的属性值进行查询。查询监测成果时,可首先对测点的测段、车道、具体位置等测点主要属性值进行选择,然后再对监测成果的测期、两期变化量、累积变化量和变化速率等条件进行设置,查询出满足用户要求的测点成果。在查询出满足要求的数据后,可导入到EXCEL中进行编辑打印。

2)数据录入和添加:包括监测点属性数据录入添加和监测成果数据录入添加两个功能,用于向数据库录入添加监测点属性信息和监测成果数据。设置有手工录入添加和自动导入两种方式,前者直接在程序界面上的相应空格中填入数据值,实现逐点录入;而后者则将文本数据格式或者EXCEL格式的数据自动导入数据库,实现多点自动导入。添加数据时动态显示已添加的数据和添加后数据库中的所有数据信息,添加完成后可以将已添加的数据导入到EXCEL中进行编辑、打印。在录入添加之前可将所要录入添加的数据按照预定的格式存储在EXCEL或记事本中,随后便可将数据导入到数据库中。

3)数据修改:考虑到操作的规范性,系统只允许对监测点属性进行修改。通过查询所要修改的监测点,对其属性信息进行修改,同时可以动态显示数据库中的监测点属性信息,方便用户及时看到修改结果。

4)数据删除:与数据修改功能相似,通过对数据信息查询后再进行删除,删除前须经确认,然后才能操作,确保准确无误。

5)数据导出:由于在前述操作中已包括本功能,因此系统中无需再单独设此功能模块,避免重复。

2．1．4在线帮助功能

包括帮助目录与帮助主题搜索两个功能,用于系统运行过程中的在线帮助,以文本和图像的形式对系统进行操作说明,并对常见问题作详细解答。

2．1．5退出功能

退出系统。

2．2系统的特点

1)系统充分利用了先进计算机技术的优势,克服了传统的监测数据管理存在的数据查询繁琐、处理分析低效等缺陷。

2)系统操作通过窗口和菜单进行,具有界面友好、操作帮助完善等优点。

3)系统可通过接口程序与外业观测电子手簿相连,下传原始观测资料,并进行计算处理,实现测量内外业一体化。

4)经系统处理的数据成果可直接导入到EX-CEL中,充分利用了EXCEL报表制作的优点,满足了用户对报表格式多样性的要求。

5)监测数据通过系统存入数据库进行管理,使复杂、繁琐的监测数据管理工作变得简单易行,如数据的查询、添加、删除、导入EXCEL等可通过鼠标单击直接实现,提高了工作效率。系统的实现与应用

系统采用Windows2000/Me/XP作为操作平台,以桌面式关系型数据库ACCESS和面向对象的程序设计语言VisualBasic6。0作为开发工具,通过数据库引擎(ADO)[7]与数据库有机的联系在一起。系统开发采用面向对象的方法,它是根据应用问题所涉及的对象,建立于现实世界的一种软件开发思想[7]。利用该方法的关键是对前端概念的理解,只有当应用领域固有的概念被识别和理解了,才能较好的设计系统的数据结构以及实现其功能。

VisualBasic是一个面向对象的图形界面应用程序开发环境,利用它可开发面向对象的基于Win-dows的应用程序[7]。由于VisualBasic充分利用了Windows的窗口资源,因而开发应用程序的用户界面美观、简洁。本系统中所使用的菜单、按钮和结果显示等功能方式均以模块化开发实现,有利于系统的后续开发升级。

系统应用过程:首先,按照系统数据库中数据表的字段格式对车站、区间段和监测点进行统一编号、命名和归类,并根据实际情况确定测点属性值,将整理后的测段信息与测点属性数据录入数据库;然后,通过系统的接口程序从外业观测电子手簿下传各期原始观测资料,对其进行预处理后将满足要求的成果数据录入数据库;最后,对监测数据进行管理和处理计算,分析地铁隧道结构变形情况。该系统在某城市地铁监测中得到了很好的应用,发挥了较大的作用,实际应用表明:

1)监测数据管理的效率得到了明显的提高。应用系统后,数据处理分析所花时间从原先手工进行所需的7d至8d缩短为1d至2d。

2)系统计算准确、成果可靠。

3)系统功能完善,操作简单,界面友好、美观。结论

地铁隧道结构变形监测数据管理系统是结合地铁隧道结构变形监测实际情况进行设计和开发的具有较高的实用价值。

1)系统应用了先进的ADO数据库开发技术实现了数据库与系统的有机结合,使Access数据库与VisualBasic语言的优势得到了最大的发挥,值得类似系统借鉴。

2)通过实践应用表明该系统功能完善、方便实用、计算准确、数据成果可靠,能够较好地满足实际应用需求,大大减少了数据管理工作量,提高了效率。

3)系统中测量内外业一体化的实现为地铁隧道自动化变形监测系统的开发积累了一定的经验。

4)系统开发运行的成功为今后地铁隧道结构变形监测数据处理与分析系统以及地铁安全监测专家系统的研究开发奠定了基础。

参考文献

[1]国家质量技术监督局,中华人民共和国建设部.地下铁道、轻轨交通工程测量规范[S].北京:中国计划出版社,2000:64-70.[2]于来法.论地下铁道的变形监测[J].测绘通报,2000(5):13-15.[3]郝传才.地铁施工监测信息系统[J].广东建材,2005(10):83-85.[4]王浩,葛修润,邓建辉,等.隧道施工期监测信息管理系统的研制[J].岩石力学与工程学报,2001(20):1684-1686.[5]TORYK.Multiple-Surveying-RobotSystemforTunnel DeformationMonitoring[EB/OL].http://www.ntu.edu.sg/cee/research/bulletin/2003_2004/pdf/SpatialInfo.pdf.[6]BASSETT,R.H,KIMMANCE,J.P,RASMUSSEN,C.Automatedelectroleveldeformationmonitoring

7.元数据管理系统设计及其关键技术篇七

元数据是描述数据的数据,其使用价值在于具体化抽象数据、提高数据管理效率和数据利用的准确性以及方便性,因此各行业都在定义符合各自使用特点的元数据标准,例如:电子政务领域GB/T19488《电子政务数据元》,交通领域JTT 747-2009《交通信息资源核心元数据》、GA 329.2-2005《全国道路交通管理信息数据库规范第2部分:机动车登记信息》,林业领域LYT 2266-2014《林业信息元数据》等。

规范元数据定义、合理有序地开展各行业元数据注册申请和审核、解决定义冲突,是元数据管理系统实施的当务之急。中国电子技术标准化研究院依靠自身在标准化方面的优势,建立一套元数据管理系统,科学合理地对元数据分门别类,并建立元数据之间的数据关联关系,提供对元数据的注册、审核管理、关联性查询、维护与网络发布功能,并提供对各行业各领域元数据定义和应用的标准化支撑。

2 软件架构设计

元数据管理系统采用B/S(浏览器/服务器)架构,用户以Internet浏览器作为工作界面,用户的主要事务逻辑通过Internet浏览器和服务器交互,事务的处理都在服务器端实现。Internet浏览器是客户端唯一需要的应用软件,省去了客户端软件开发和维护的成本;管理软件安装在服务器上,实现元数据的分类、注册、审核管理、关联性查询、维护与网络发布功能,并以Https、Web Service协议形式提供服务。

2.1 HTTP服务器技术体系选择

搭建HTTP服务器有两种主流技术:Apache httpd和IIS。Apache httpd技术是Apache组织的开源HTTP服务器项目,目前最新版本是2.4.23,可以运行在Unix、Linux或者Windows操作系统上,其源代码开放,用户可以了解底层实现技术细节。IIS服务器由微软开发,最新版本8.0,只能运行在Windows操作系统上,需要购买正版Windows系统,源代码不开放。

在Apache httpd和IIS的选择上,我们首先用Apache Bench性能测试工具比较两种技术的处理性能,在相同硬件环境下,准备一个静态网页index.html,文件大小为73 k字节。执行10 000个到index.html的HTTP GET请求,最多100个并发处理,IIS8.0每秒可处理请求数=1 821[#/sec],平均每个请求处理时间=0.565[ms];Apache Httpd 2.4.23每秒可处理请求数=1967[#/sec],平均每个请求处理时间=0.521[ms]。Apache Httpd 2.4.23对网页浏览的处理性能略好于IIS8.0。

另外,Linux上的Apache从2.4开始采用event MPM(多处理模块)。此模块通过把一些处理工作交给监听线程,从而释放工作线程的部分压力来处理更多的新请求。这是一个混合的多进程多线程服务器,使用epoll事件驱动。在4G内存、10核双CPU服务器上,理论上可以处理超过10 000个并发处理。

综合考虑以上因素,元数据管理系统的服务器技术采用Apache httpd 2.4.23。

2.2 模块化设计

元数据管理系统采用模块化设计模式,将整个应用业务以独立功能为单位进行分割,使得系统具有清晰的逻辑结构。模块划分为注册管理、关联分析、系统管理、数据库管理、工作界面、安全管理等模块。详见图1。

3 关键技术

3.1 数据关联

元数据管理系统的数据关联技术,就是要从大量的元数据集中发现元数据之间的关联性,从而为各行业的元数据注册、审核管理、关联性查询等,提供标准化支撑。

元数据具有标识类字段(名称、英文名称、中文全拼、内部标识符)、管理类字段(注册状态、注册机构、生效日期)和定义类字段(定义、对象类词、特性词)等。不同元数据之间的某些字段在语义层上可能存在一定的相似度。元数据相似度计算算法,就是通过计算元数据的名称、定义、对象类词、特性词等关键字段的加权平均Levenshtein距离来确定元数据之间的关联关系。

Levenshtein距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符、插入一个字符、删除一个字符。

例如“ABCDEFG”和“BDEH”两个字符串,最大长度为7,有4处不同,所以相似度为1-4/7=0.429。

元数据相似度计算算法流程如下:

首先定义相似度函数——edit(i,j),它表示第一个字符串的长度为i的子串到第二个字符串的长度为j的子串的编辑距离。可以用如下迭代公式计算这两个字符串的相似度:

if i==0且j==0,then edit(i,j)=0

if i==0且j>0,then edit(i,j)=j

if i>0且j==0,then edit(i,j)=i

if i≥1且j≥1,then edit(i,j)==min{edit(i-1,j)+1,edit(i,j-1)+1,edit(i-1,j-1)+f(i,j)},当第一个字符串的第i个字符不等于第二个字符串的第j个字符时,f(i,j)=1;否则,f(i,j)=0。

元数据的相似度是综合元数据名称、定义、对象类词、特性词等单个关键字段的相似度来决定的。一种简单的计算方法是:元数据的相似度=各个字段相似度的算术平均。在实际运用中,可以加大定义、对象类词、特性词的权重,实现加权平均Levenshtein距离。

3.2 审核管理

元数据管理系统实现对标准元数据的注册申请的审核管理。注册机构通过管理系统提交元数据注册申请;经过管理机构审批通过后,元数据被写入元数据库。元数据注册的审核管理业务流程见图2。

注册机构通过元数据管理系统提交注册申请,申请类型可选为:新增、修订、废止,申请状态为“B-形式审批”。管理机构经过形式审查和技术审查,更新注册申请的状态为“E-标准”或“D-未批准”。具体注册申请状态详见表1。

审核分形式审查和技术审查,技术审查必须有2个对口领域专家和1个交叉领域专家参与审核。管理机构人员对所归属的注册信息进行形式审核。审核通过后提交到技术审查,管理机构人员可以通过专家库干预和设置技术审查人,专家库专家可以拒绝指派,也可以主动认领,此时注册申请的状态变为:A全部主动认领、B部分主动认领、C无人认领。技术审查时,专家需要填写技术审核表,评审结果存在于审核表中,管理机构人员根据技术审核结果,如果2个以上(含2个)技术审核通过,判断本次元数据注册申请成功。

4 系统高可用性设计

为了实现系统高可用性,我们采用主备机制、分布式数据库和集群服务器等主要技术。首先为了提高系统的可靠性,防止由于客观因素及人为误操作等原因造成系统损坏和数据丢失,必须建立服务器安全保护机制,服务器采用主备机制提供备份。同时为了在高并发情况下,保证系统服务的高可用性,缓解对单台服务器的访问压力,系统采用集群化设计,业务处理服务器和数据库服务器都采用分布式设计,系统服务和数据库分布到多台物理服务器。并且,系统具备热备份、完全恢复、选择性恢复、时间点恢复功能。

同时,系统设计具备可扩展性,服务器节点数、主备数可以根据业务需要而扩展。初期支持将系统服务和数据库部署到4~8台物理服务器上。系统服务器集群的主备架构设计可以参考图3。

4.1 主备切换

为了确保系统高可用性,元数据管理系统具备主备切换能力。当某台服务器出现故障(电源故障、网络故障、硬盘故障)时,能及时切换到备用服务器,保证整个系统不间断地提供服务。

元数据系统的主备切换方案如下:

(1)主机向备机定时发送状态帧,备机收到状态帧后,将内部计时器清零,标志主机工作正常。当备机连续N秒没有收到状态帧时,备机主动切换成主机并向对方发送切换完成帧,随后,新主机开始向备机定时发送状态帧。

(2)主备切换后,新主机内部各个服务模块会通知集群内其他服务器进行状态上报、数据收集。

(3)初始状态的确定:服务器A启动时以备机状态监听主机,如果系统内没有主机在运行,监听超时后自动切换为主机;服务器A启动后,如果系统内已经有主机在运行,服务器A直接进入正常备机监听状态。

(4)数据同步:备机启动后,由于此时主机和备机的差异比较大,主机会将当前状态和数据批量发送到备机,备机实现同步备份,这个过程称之为初始备份。初始备份过程结束后,系统进入实时备份过程,当主机数据发生变化时,备份数据将实时同步到备机。

4.2 负载均衡

单台服务器的CPU性能和内存资源都是有限的,支持的连接并发数都有上限。元数据管理系统采用负载均衡技术和多服务器集群的方法来支持高并发数,实现原理如图3集群服务器架构所示。

HTTP服务器可以采用双网卡设计,运行负载均衡器算法,可将Web访问IP地址映射为多个内部IP地址,对每次TCP连接请求动态使用其中一个内部地址,达到负载均衡的目的。负载均衡器一般采用随机选择,根据内部服务器的连接数量或者响应时间作为负载均衡策略来分配负载,并将这种技术作为网络协议第四层交换的一种功能来实现。另外把双网卡Http服务器配置成DNS服务器,也可以简单地实现网络负载均衡。

5 结语

元数据为描述数据信息而诞生,随着信息技术的快速发展,元数据在信息资源共享过程中将起着越来越关键的作用。元数据的分类、注册、审核管理、数据关联、关联性查询等是元数据管理系统实现的重点。在将来的工作中,要结合信息技术领域的新进展,对上述元数据管理机制做进一步完善。

参考文献

8.地理元数据技术系统的设计与实现篇八

关键词：煤矿地质；地理信息系统；设计；实现

随着我国国民经济的不断发展，计算机技术在我国普及开来，在我国多个领域得到广泛的应用，有效降低工作人员的工作量，提高安全系数。为积极响应“推进地质资料信息服务集群化产业化”[1]发展的工作要求，根据资源部门的方案，积极收集与整理本区域1：20万的地质资料、矿区数据以及地质灾害数据库等，以保证地质资料数据的一致性，积极进行信息系统的建设，以推动地质资料信息服务集群化产业化工作的发展，打好数据基础。但是现阶段我国煤矿地质部门还沿用传统的数据管理形式，不仅管理效果不明显，反而会对煤矿数据的存储、使用与检索等造成阻碍，因此需提高信息系统建设的力度，以满足信息系统现代化发展的需要。

一、煤矿地质地理信息系统发展的现状

现阶段，国外的煤矿地质地理信息系统是在ArcGIS桌面的基础上发展而来的一种二次开发，对现存的地理信息进行充分利用，例如：钻探资料、TIN、DEM等，能够根据相关数据资料构建二维地质画面[2]，但对地质空间模型的探究力度相对不足。受到数据空间模型支持、制图规范化等因素的影响，阻碍信息共享与存储管理的发展。现阶段，人们对于煤矿地质信息系统的还未有明确的定义，但实际上，它涉及到多个学科，例如地质学、计算机、采矿学等，且在制图过程中又需使用制图软件CAD，但是在信息共享与复杂空间分析中存在严重不足。随着科学技术的不断发展，GIS技术被应用到煤矿地质地理信息系统的建设中，推动煤矿地质地理信息系统的发展。GIS具有以下优势：①界面统一：操作功能均在用户界面有所体现，不仅操作简单，而且极为灵活，例如：输入输出、三维可视化、地质信息管理等；②权限统一：根据煤矿生产的流程，制定针对性的管理权限，推动信息管理向着无纸化、网络化的方向发展；③三维化：凡是煤矿区域中的对象，均能够三维建模，并进行储量计算与剖切分析；④数据统一：通过一体化数据库统一管理煤矿信息系统，确保数据信息的一致性，实现数据共享。[3]

二、煤矿地质地理信息系统设计中的关键技术

1、面向对象设计

建模语言统一主要是利用文档化、构造、可视化的语言对存在于软件密集型系统中的制品进行描述。早在1997年，对象管理组织就针对统一建模语言进行了规范，主要是为设计人员提供统一的设计与软件开发用语。统一建模语言的使用，为开发设计人员的系统架构与设计进行了规划。随着时间的不断推移，统一建模语言[4]已得到普遍的认可，不仅提高了工作人员间的沟通与交流，而且能够及时发现疏漏与错误，以提高设计成果的准确性与精确性。例如：在本次煤矿区域地质图设计整理过程中，工作人员根据实际的地层对其进行合理、适当的街边与合并处理，以有效解决现有地质图中存在的数据库建设问题以及投影信息等，以完善我国地理底图中的数据资料，严格按照国家标准使用同一的花纹库、色库、线型库、符号库等。

2、空间数据库模型

在煤矿基础数据的收集过程中，工作人员需对通风线路图、运输线路图、排水线路图、机电设备配置图等数据资料进行收集，并以此为依据，构建标准化、规范化的符号库，以整合多元数据结构[5]，提高数据资料的利用率。煤矿井下地理坐标的获取是利用地面控制点使用一定的方式进行导入，例如斜井定向、竖井定向等。在本次数据收集中使用北京54坐标，以提高获取数据资料的精确性。煤矿在日常生产过程中，存在规模较大的空间数据，可利用空间数据进行建模。

3、多元数据处理

（1）编制地质图件与录入数据

在煤矿正常生产过程中，会产生大量的纸质文档与图件，且有的纸质文档与图件的历史较为久远，煤矿地质地理信息系统需要日常管理这些数据资料，同时，还需整合GIS系统所需的数据信息。纸质文件、图件进行扫描，表格数据进行重新录入。数据资料中存在的地形图与钻孔柱状图的完成需以下3个步骤：①手工绘制，并扫描底图，然后再利用计算机进行编辑；②通过图系统软件自动转化为图；③利用人际交互式方式实现转换。不仅大大降低工作人员的工作量，而且还大大提高工作效率[6]。

（2）格式不同数据的转换

现阶段，我国煤矿多使用CAD进行绘制，因此大部分格式是dwg，有时为了GIS系统的信息分析与管理，需要在CAD的基础上提取信息，例如：地形等高线、控制点、钻孔点等，利用ArcGIS[7]转换工具进行数据转换，也可通过FME转换煤矿数据。受到数据组织方式的影响，需在重组的过程中进行分层，也可使用人工对数据资料中的错误进行处理。

（3）文件版本的控制

为了能够有效管理煤矿相关的地质图件，在系统的设计过程中特意增加文件版本控制，能够把煤矿制图中存在的GIS图件或是CAD图件进行压缩后，传送至FTP服务器或是Oracle服务器中，利用Hash算法对文件对应的Hash值进行计算，同时确定其是否需要更新，同时该模块还具备下载、上传以及查询等功能。

三、在GIS煤矿信息可视化的基础上分析空间

在煤矿地质工作过程中，必不可少的基础资料是地质剖面数据与地质钻孔数据，近年来一直在GIS煤矿信息可视化的基础上进行。现阶段，我国地质领域中很少使用ArcGIS，主要是因为发展还未完善，受到煤矿地质较为复杂的影响，可视化与空间分析存在很高难度。例如煤层不完整、地质不连续等均会大大增加建模的难度。现阶段，我国普遍使用分块与严格限定边界等方法进行处理，分块的实质也是对边界进行限定，但是需保证限定区域之间的连通性。限定边界看似简单，但是对数据算法与预处理提出更高的要求，需要进行后期处理。煤矿地质建模流程图见图一：

图一煤矿地质建模流程图

1、钻探信息的可视化

对钻探数据进行细化：测斜数据、钻探、基础钻孔数据，以真实有效的显示煤层与钻孔的三维空间分布情况，表格之间是利用钻孔编号进行构建与联系的，但实际上，各表内容具有独立性[8]，只是在逻辑方面存在关联性，能够有效消除数据资料的冗余性。三维钻孔准状突需利用钻探分层厚度进行偏移量的设置，以测斜数据为例，详细情况见图二：

字段名称类型空备注

Partld（分段编号）Int否随着测斜分段工作进程的推进，顺序变大

Dip（倾角）Doublc否该点与下点之间的夹角

Holcld（钻孔编号）String否钻孔编号

Dcpth（测斜深度）Doublc否

Azimuth（方位角）Doublc否该点与下点之间的方位角

图二测斜数据图

2、表面建模法

（1）空间插值方法

煤矿区域中煤床储量与空间分布遵循矿产资源具备的规律[9]，严重影响我国矿山的资金投入情况。在探究煤矿经济性与可行性评价过程中，需要优化煤矿矿山设计规划，否在会对煤矿决策产生不良影响，影响煤矿正常的开采计划。在实际操作过程中，煤矿地质数据的获取过程中受到监测技术的影响，因此只能得到采样点位置的地质数据，需要工作人员根据已有的数据资料对整个煤矿区域中的抵制进行推算。空间插值主要是根据已知数据治疗对整个煤矿地区中的地质特点进行推断，以提高数据资料的密度与质量，要求工作人员需要熟练掌握地质空间规律，对煤层底板与品位计算进行等高线生成。工作人员可依据钻杆与钻孔获取煤层底板中通过标高的空间插值，从而计算出煤层厚度与煤层底板的等值线。

（2）等值线法

与煤矿地质有关的等值线类型包括多种，例如：煤矿底板等高线、煤层厚度等值线、地形表面等高线、岩层底板等值线等。其中地形等高线主要是对煤矿表面的表示，等高线是指具备同等高程值的线。而等值线[10]在煤矿中的使用，大大降低获取数据信息的难度，因此我国的地形图中普遍使用此种方法。例如，首曲线也可称为等高线，是指根据地质等高的要求进行等高线的绘制，一般使用0.1mm的细实线表示；计曲线主要是为了方便阅读，每间隔四根等高线，就需进行一根等高线的加粗，加粗的等高线就属于计曲线，一般粗度为0.2mm，以便于两点之间高差以高程的计算。

四、煤矿地质地理信息系统的实现

在实际操作中，涉及到本区域的有关于1：20万的地质图总共存在53幅，因此工作人员对其进行查阅，并使用1956年黄海高程系进行煤矿地质地理信息的绘制。本区域位于东经105—111°，北纬31—40°的区域中，存在六度分带2个，利用北京54坐标系进行，使用高斯—克吕格横切椭圆柱作为角投影使用。

以对本区域中各个县市的地质灾害进行调查完毕，并构建了区划空间数据库，其中包括地质灾害点属性数据与地质灾害分布、易发区等，相关图形数据通过MAPGI6.7的格式进行储存。

在完成本区域中的煤矿核查工作后，也对矿区范围的界限进行明确，原数据以地理坐标系文本文件进行保存，而在本次操作中，工作人员统一整理了煤矿范围界限，并对其进行投影转换，录入、套合、数据转换、数据整理等操作。

现阶段，我国地质图数据是通过MapGIS平台格式进行储存，但是在集群化产业项目中确是以ARCGIS平台存在，因此在数据入库前，需对数据格式进行转换，统一转换前后的命名与储存。

结语：

综上所述，煤矿地质地理信息的获取难度较大，因此需要统一的数据库对数据图形等进行管理，这就促使其向着信息服务集群化、产业化的方向发展，满足煤矿地质信息操作中的需求，提高了煤矿信息的可视化，并将所检测到的地质数据信息通过二维、三维图形提供给用户，实现数据信息的共享。

参考文献：

[1]纪晓东，王双龙，张峰.深圳市地质地理信息系统设计模型的设计与实现[J].测绘通报，2010，01：59-63.

[2]曾立斌，黄牧，戎晓力.地下工程施工监控地质地理信息系统研究[J].岩土力学，2010，S1：342-348.

[3]王玉刚.煤矿通风地理信息系统设计与实现[D].西安科技大学，2013.

[4]葛琳，李肖枫，姚文涛.基于WebGIS的城市学校地理信息系统设计与实现[J].科技致富向导，2009，08：94+92.