基金项目:国家“十五”重点科学工程《昆明市地震活断层探测与地震危险性评价》项目(编号:25-4)资助.
(Earthquake Administration of Yunnan Province,Kunming 650224,Yunnan,China)
active fault; information management system; database; foundation data; thematic data
备注
基金项目:国家“十五”重点科学工程《昆明市地震活断层探测与地震危险性评价》项目(编号:25-4)资助.
结合中国地震活动断层探测技术系统技术规程,介绍了昆明城市活断层信息管理系统及数据库建设的目标、原则、要求、功能及其所需的硬、软件环境及其构架,专业数据库软件的选择,各基础数据及专题数据的转换、组织、入库、编码等规范化操作。针对昆明城市活断层项目数据库建设过程中遇到的问题,阐述了作者及相关工作者在建库过程中摸索出来的有效方法及思路,供相关工作人员参考。
The active fault information management system of Kunming City and related database has been built based on the technical stipulation of active fault survey in China.We introduce the objective,principle,requirements,function and necessary hardware and software environments of system construction,also the structure of the system,the choice of professional database software,and the standardized operation of foundation data and thematic data(including data conversion,organization,storage,coding,and others).We give the effective methods and ideas for solving the problems during database construction.These methods and ideas can provide reference for relevant researchers.
引言
我们建设了一个既严格遵从《活动断层信息管理系统基础数据库规定》,又符合昆明市活断层探测实际的昆明市活断层探测基础数据库,用于存储昆明市活动断层探测、地震危险性与危害性评价成果。在此基础上,我们还建成了一个数据共享、稳定性高、能满足地震活动断层探测研究和应用需要的信息管理系统,用于昆明市活动断层探测、地震危险性与危害性评价成果显示和管理,为各级政府部门及社会提供咨询服务,亦可供城市建设规划与土地利用、重大工程选址、建筑抗震设防和震时灾害的快速评估、政府决策和指挥部门的应急救灾使用。
1 活断层信息管理系统建设
1.1 工程目标建设用于活动断层探测、地震危险性与危害性评价成果存储、显示、管理与分析的设备、技术支撑平台,为各级政府部门及社会提供咨询服务。
1.2 建设原则(1)按照中国数字地震观测网络所确定的科学目的、规模与技术指标的要求进行设计,建设一个数据共享,稳定性高,能满足地震活动断层探测研究和应用需要的活动断层信息管理系统。
(2)实行统一规程、统一计划、统一设计。
(3)关键设备宜采用国际上的先进产品。地震活动断层地理信息子系统专用软件采用招标形式进行采购或统一开发,在保证工程技术水平与质量的前提下,因保密需要,应尽量采用国内专用软件产品。
(4)按照总体设计要求和技术系统建设规范,对各地已有设备和软件作必要更新,以期达到当前国际水平。
(5)项目建设所需工作人员的定员由各承建方确定。
(6)由于各区域原有基础不同,现有条件不同,地震危险性不同,经济能力也不同,其建设内容和规模可有所差异(中国地震局,2005)。
1.3 技术指标(1)活动断层信息管理系统基础数据库的数据结构合理、数据项完备、内容符合规定,可满足地震活动断层探测研究、地震危险性评价、地震危害性评估等工作的需要。
(2)区域地震构造研究数据基于1:25万比例尺进行建设; 目标区活动断层数据基于1:5万比例尺进行建设; 主要地震活动断层研究基于1:1万比例尺进行建设。
(3)系统的各种软硬件达到配置合理、功能齐备。
(4)系统基于网络和GIS 技术运行,实现网络、数据和系统的有限互通,可实行单机、B/S 和C/S 结构的系统混合运行(中国地震局,2005)。
按照活断层信息管理系统建设的目标、原则、技术指标的要求,昆明城市活断层信息管理系统的硬、软件环境如图1所示。由图1可见,昆明城市活断层信息管理系统是基于C/S结构运行的,按活断层规范的要求,城市级的信息管理系统可以是基于C/S架构。由于没有采购服务器(Server),目前采用一台工作站作为服务器,将Oracle数据库和ArcSDE同时安装在“服务器”上,客户机上则安装活断层信息管理所需的ArcGIS DeskTop、城市平台软件、地震危险性评价软件及综合处理软件等。客户机上的应用软件可以通过ArcSDE与Oracle进行存储、调用、查询、修改等操作。该管理系统选用国内、国际上最为先进的ArcGIS作为GIS平台,大型数据库系统Oracle作为后台数据库管理系统,其他几种活断层管理软件都是在此基础上开发的(李西等,2005,2007)。
2 活断层数据库建设
3 数据转换及导入中遇到的问题及解决方案
3.1 数据转换问题及解决方法由于原始数据,尤其是一些专题数据是Mapinfo格式的,而我们要求的入库格式是ArcGIS可接受的标准格式,这就需要进行数据的转换。利用Mapinfo软件将Mapinfo数据转换为ArcGIS格式时需要注意的问题是:在选择目标(Destination)转换所在的目录(Directory)时,一定要使用全英文目录,否则,数据不能够成功转换。在这一步转换过程中,可能还会碰到源数据(Source)目录也需要全英文目录的问题。为了转换方便,最好将需要转换的原始数据也放在一个为全英文目录的文件夹下(图4)。
还有一种将Mapinfo数据转换为ArcGIS格式的方法。那就是在ArcCatalog 中打开ArcToolbox,双击ArcToolbox 下面的转换工具Conversion Tools 下面的To Shapefile。双击To Shapefile下的Feature Class To Shapefile(multiple),弹出一对话窗口,在对话窗口的Input Features 中选择要导入的Mapinfo Tab 表下面与该空间要素类相同的几何类型,如断裂,选择断裂polyline,然后可以继续增加多个要转换的tab 表,在OutpoutFolder 中选择输出的路径,点击Ok。该工具可以同时将CAD 的数据dwg 及dxf 格式转换为shp 格式。
3.2 数据导入的问题及解决方法在数据导入到标准模板时可能会存在数据类型的匹配问题。由于在活断层数据库模板中的各要素的各字段类型都是已经设置好了的,如果从MapInfo转换过来的数据类型不能与模板中的数据类型相匹配,在进行数据导入时就会出问题,无法将数据导入到标准模板中。例如,在MapInfo中的某一要素的某一个字段(field)设置的是integer(长整型),而ArcGIS数据库模板中的相应字段类型是Long integer,似乎这个字段转换过后的数据类型一定可以匹配。然而将MapInfo中的相应字段转成ArcGIS形式后,其字段类型变成了双精度(double)类型,这与模板的数据类型不匹配,无法将数据导入。在实践中,笔者发现在MapInfo中将原来的integer改成small integer类型后,再转换成ArcGIS格式后其数据类型变成了Long integer,这就与模板相匹配,可以进行数据导入。当然,这种情况并不是在所有的MapInfo数据转换为ArcGIS数据过程中都会碰到。
在1:25万区域地震构造图中,其产状层Fault-Attitude在Mapinfo中是以线文件的形式存储的,而我们的数据库模板中只有点形式的要素集文件。要将Mapinfo格式文件转换后的数据文件导入到数据库模板中是不可能实现的,因为它们二者的几何结构类型(Geometry Type)不相同,前者是线文件,而后者是点文件。笔者将MapInfo格式的相应文件存为”Microsoft Access Database(*.tab)的“*.mdb”格式的文件后,就可以在ArcGIS的数据库模板中将转换后的数据导入到模板数据库中,但这种方法仅限于往模板中导入属性数据。
4 坐标系统之间的转换
在实际工作中,笔者发现许多前期工作得到的测量数据都存在坐标系统不统一的问题。由于数据库标准模板要求的坐标系统是“Xian_1980”坐标系,而实际上很多数据都是WGS84或“北京54”坐标系,这就需要进行坐标系统之间的软换。
4.1 “北京54”转为“西安80”的实用转换方法在实际应用中,采用系统转换加平差改正数的方法实现“北京54”到“西安80”的转换(何云鹅等,2007)。根据理论推导和实际计算,各种比例尺地形图的高斯平面坐标改正量只需使用一个图廓角点的改正量即可,现统一使用各图幅左下角图廓点的改正量,即每幅图采用左下角图廓点的坐标改正数进行东西和南北方向的平移,实现“北京54”到“西安80”的转换(蒋辉等,2007)。国家测绘局大地数据处理中心(西安)提供“北京54”系到“西安80”系的坐标改正量。
获得图幅坐标改正数以后,在GIS平台中利用图幅坐标的平移可实现“北京54”到“西安80”的转换。如:在ARC/INFO 平台中利用“TRANSFORM”功能,在MAPGIS中利用“误差校正”功能,均能实现北京54系图幅到西安80系的转换。
由于软件系统中的X、Y 坐标轴方向与高斯投影中X、Y坐标轴方向不同,因此DX、DY改正数使用时要注意正确使用改正方向。
4.2 “WGS84”转为“西安80”的实用转换方法“WGS84”坐标系是美国国防部根据TRANSIT导航卫星系统的多普勒观测数据建立的,从1987年1月开始作为GPS卫星所发布的广播星历的坐标参照基准。采用WGS84椭球,原点位于地球质心,是一种地心坐标系(孙江勇,2006)。
在活断层项目研究过程中,有不少测量工作是直接采用手持GPS进行测量的,有些数据也是直接选用GPS默认的坐标系统(WGS84)测量得到,如浅层勘探线捌点坐标。
常用的转换方法是将两个坐标系统之间的DA,DF,DX,DY,DZ五个参数求出来,然后进行坐标转换。其中:DA的含义是两个椭球基准之间长半轴的差; DF的含义是两个椭球基准之间扁率倒数的差,这两个参数用于两椭球基准的转换; DX,DY,DZ是利用WGS84坐标系的X、Y、Z值,减去西安80相对应点的坐标系值,得出实现坐标系统转换的三个参数,这三个参数的作用是实现两个不同参考椭球的原点重合。当5参数都求出来以后,还必须对其进行验证。验证的方法是在应用区域内选择5个以上水准点进行实测,实测值与测绘部门提供的理论值对比,如果最大误差不大于15 m,平均误差不大于10 m,则计算出的参数可以使用,否则要重新计算或查找出现问题的原因(丁海鹏,2006; 陈贻胜,2006; 张军龙等,2007)。
在实际工作中,在求5参数的过程中可能会碰到拿不到水准点资料的问题。工作者可以从“西安80”坐标系统的地图中找出几个特征点,这些点必须是在现场能找得到且方便定点测量的点,且在工作图幅范围内分布比较均匀,并从图中读出这些点的“西安80”坐标。然后用手持GPS(其坐标系统与需要转换的数据的坐标系统一致,这里是WGS84)去实地分别测量这些特征点的坐标值。用测量出的WGS84的值减去图上得出的相对应点的值,求出每个对应点的DX,DY,DZ值,最后求出几个点的平均DX,DY,DZ值作为最后坐标转换的三个参数。由于DA,DF可以从资料中查到并计算出来,这样5参数都可得到。有了5参数就可以利用坐标系统转换软件将WGS84转换为“西安80”坐标。
5 图形要素编码中碰到的问题及解决方案
每一个专题入库以后,要对每一个专题下的要素类进行编码。一般是运用中国地震局开发的城市平台软件HD01中的城市活断层数据探测数据采集与管理模块对各要素集下的每一个要素进行编码。该方法的优点是不用输入行政区划编码和表代码(要素编码),只需用户输入自定义码,点击补齐按钮就可以进行自动补齐,这样便能完成单个要素的编码(图5)。这种编码方法适合于要素较少的要素集,但是,如果每个要素集中有成百上千个要素的话,这种方法显然不太可取。笔者在实际工作中发现,对于要素较多的要素集来说,采用Excel软件来进行编码比较方便。首先:用HD01软件,给要编码的要素集编好一条记录的编码,这样用户不必再去查找相应的行政区划编码和表代码; 再在Access数据库中打开数据库模板中需要进行编码的该要素集(表),将要进行编码的列复制到Excel表中(图6)。
然后拉动图6中选择框的右下角,便可完成如图7所示9条记录的编码(图7)。
6 结语
“城市活断层信息管理系统及数据库建设”是国家“十五”重点项目“地震活断层探测与地震危险性评价”项目的一个子项目。地震工作者在“地震活断层探测与地震危险性评价”项目研究过程中,获得了许多宝贵的地震研究资料。为了有效、规范地管理好这些资料,项目组按照中国地震局制定的相应规范进行了“城市活断层信息管理系统及数据库建设”工作,为活动断层探测、地震危险性与危害性评价成果的存储、显示、管理与分析搭建了平台。
规范化、标准化的“城市活断层信息管理系统及数据库建设”,是数据实现集成、共享的基础,同时也为城市活断层项目研究的扩展提供了较好的数据管理平台。
- 陈贻胜.2006.坐标转换参数的求解方法及其应用[J].上海地质,(2):53-56.
- 丁海鹏.2006.手持GPS坐标系统转换参数求解方法的探讨[J].中国煤田地质,18(3):73-74.
- 何云鹅,王珍,任强.2007.城市坐标系统不确定性影响分析[J].城市,(8):68-70.
- 蒋辉,夏勇,樊朝俊.2007.北京54坐标系坐标转换的探讨[J].南京工业大学学报,29(4):73-76.
- 李西,崔建文,郭君.2007.基于MapX的云南省数字强震台站管理地理信息系统的设计及开发[J].地震研究,30(2):201-204.
- 李西,高建国,郭君.2005.矿区多媒体地理信息系统设计[J].昆明理工大学学报(理工版),30(2):7-10.
- 孙江勇.2007.手持CPS坐标系统转换参数的求解方法[J].新疆有色金属,(2):91~92.
- 张军龙,田勤俭,李智敏,等.2007.差分GPS方法在城市活断层探测中的应用探讨[J].地震,27(3):74-81.
- 中国地震局.2005.中国地震活动断层探测技术系统技术规程[M].北京:地震出版社.
活断层的各种数据(如基础数据、专题数据等)的入库流程如图2所示。由图2不难看出,活断层原始数据的格式多种多样,有栅格的和矢量的空间数据,也有表格式的和文档式的属性数据,另外还有图片文件等。可见,如果没有一定的数据库建设规范,活断层数据库是无法有序地、高效地管理好这些数据。
2.1 基础数据库数据建设2.1.1 总体要求为了保证城市间及城市与国家活动断层信息管理中心数据的交换,应遵循活动断层探测基础数据库建设的规定。基础地理信息应遵循国家相关标准,对于行业应用的地理信息须遵循活动断层探测研究基础数据库技术规范。
2.
1.2 建设原则区域地震构造研究数据库应基于1:25 万比例尺建设,目标区活动断层探测、地震危险性评价及地震危害性分析等相关数据库应基于1:5 万比例尺建设,主要地震活动断层调查研究相关数据库应基于1:1 万比例尺建设。
2.1.3 功能活动断层探测基础数据库是活动断层信息管理系统的基础和核心。基础数据库应具有以下功能:
(1)为活动断层探测工作的各阶段提供基础地理信息;
(2)记录活动断层探测工作的信息与成果; 为活动断层地震危险性分析和地震危害性评价提供基础数据;
(3)记录活动断层地震危险性分析和地震危害性评价的研究成果。
2.2 专题数据库数据建设专题数据主要由各个单位自己按照项目要求进行数据的组织,其数据的规范和专业统一,只是组织的方式不同,按照专题来进行。
2.3 数据库编码规范活断层数据库使用要素/记录标示码作为主键/外键维护着大量的关联关系,当数据汇交到全国数据库时,必须保证这些标示码的可标识性,也就是在一个城市数据库中唯一的标示码,在全国数据库中也必须唯一,这需要数据库编码规范来约束对要素/记录的标示码的命名规则。
2.3.1 基础数据规范基础数据规范由国家基础地理信息中心,参考现有最新的国家技术标准和行业技术规范,在经过需求调研和技术实验的基础上制定的。在该规定中,对基础数据的各地形要素的坐标系统、精度要求、现势性要求、数据接边要求、元数据的要求等都作了具体的规定,并对数据组织(要素分层、属性定义、分类代码、数据格式、数据成果与组织形式)作了明确了规定。
2.3.2 专题要素规范(1)专题要素集命名规则
1 2 3 4 5 6 7 8 9
subject ×××××× × ××
行政区划编码 施工期次 专题号
若专题号为个位数则在其前加“0”,如昆明(行政区划编码为530100)活断层探测项目中1:25万区域构造制图专题属于1期探测项目,其专题号为“5”,则专题要素集名称为“subject 530100105”,如图3所示。
对于活断层探测工程未分一期、二期的城市,编码的第7位施工期次可为0。
(2)专题要素集中要素类的命名规则
XXX…X 1 2 3
专业要素类名称 × ××
施工期次 专题号
若专题号为个位数则在其前加“0”,如专业要素集“Geology”中的“Stratigrahy25”按照专题成果来入库,放在专题要素集“subject530100105”中的名称就为“Stratigrahy25105”(图3)。
(3)要素、表编码的规则
1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6
×××××× ××× ××××××××
行政区划编码 要素类/表代码 自定义编码
编码为字符型,可以由26个大写英文字母、阿拉伯数字、以及ASCII的其它标准字符集组成,不能是中文字符。由3个部分组成:行政编码+要素类型编码+用户自定义编码组成,总长度为17
位。如昆明的某一条断层的编码为530100B05#######7,其中:530100是行政区划编码,B05是断层要素的代码,#######7是自定义编码。
(4)工程编码规则
1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7
×××××× ××× ××××××××
行政区划编码 工程表代码 工程结束时间
对于昆明活断层探测项目钻探工程表的代码为F18,工程结束时间为2006年6月11日,则工程编码为:530100F1820060611; 若没有结束日期就用”0”补齐到17位。
(5)工程记录档案编码的规则
工程记录档案主要包括探测中所形成的报告、图表、图像、数据(前3项包括原始和标准格式)、报告编号、图表编号、图像编号、数据编号见表1。
档案编码的命名规则:
1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0
×××××× ××× ×××××××× ×××
行政区划编码 要素类/表编码 用户自定义编码 文档简码
档案编号(第2类编码)长度为20个字节,其中的行政区划编码、要素类/表编码、用户自定义编码同第1类编码的定义,一般文档简码部分的前2位是档案字段名称“_”符号之前部分的前两个单词的开头字母,如果只有一个单词,则取单词的前2个字母,简码的第3位只能取D,C,I,W之一,用来表示档案类型是文档、图表、图像或者是原始格式的数据 中国地震局.2007.活断层探测及研究成果数据规范.。