矢量数据属性信息无损栅格化的实现方法,nfo是什么文件

文件 8
第12卷第3期2010年6月 地球信息科学学报 JOURNALOFGEO2INFORMATIONSCIENCE Vol112,No13Jun1,2010 矢量数据属性信息无损栅格化的实现方法 ———以全国1∶25万土地覆被数据为例 白 燕1,
2,廖顺宝
1 (1.中国科学院地理科学与资源研究所资源环境与信息系统国家重点实验室,北京北京100049) 100101;
2.中国科学院研究生院, 摘要:矢量和栅格是GIS应用中两种基本的地学数据格式。
与矢量数据相比,栅格数据利于空间建模和空间分析,且是空间尺度分析应用中常用的数据格式。
一般来讲,较大尺度的矢量数据,涉及到保密性和知识产权的问题,若将这类矢量数据栅格化后,所得栅格数据由于其空间坐标精度相对降低而更易于实现数据共享。
随着地学信息收集技术的不断发展,栅格数据正逐渐成为地学应用主要的数据格式。
然而,传统的栅格化是一个伴随有属性信息损失的过程,主要原因在于一个栅格单元区域内存在混合类型。
针对现阶段栅格化过程中的这个问题,本文以2005年全国1∶25万土地覆被矢量数据为例,提出了一种在ArcGIS软件环境下,依据“在一个单元格网中,一种土地覆被类型表达为一个GRID图层”的原则,结合POLYGRID命令及其{LOOKUP_TABLE}INFO文件进行土地覆被矢量数据无属性信息损失栅格化的方法。
该方法可为相关研究人员在今后处理和分析地理空间数据的工作提供新的思路,以及为空间尺度的应用研究提供有价值的参考。
关键词:矢量;属性信息无损;栅格化;方法
1 引言 矢量和栅格数据,随着地学信息采集技术(如遥感和全球定位系统等)的不断发展,正逐渐成为地学应用基本的数据格式。
栅格与矢量数据相比,栅格数据更适合诸如空间叠加、空间相关和空间模拟等空间分析[1-4],而且一般来讲,较大比例尺矢量数据都会涉及到数据保密性和知识产权的问题,将这些数据转换为栅格形式后由于空间坐标精度的相对降低,可以方便地实现数据共享。
不仅如此,栅格化还是一种能够高效处理空间尺度问题的方法。
例如,要从某个大的区域范围内较大尺度的空间数据中获取相同区域范围较小尺度的空间数据,常用的有两种方法,即制图综合和栅格化。
但制图综合方法不仅周期长,还需要参考该区域的其他信息才能完成;栅格化方法不仅快速高效,且不需要借助外加信息就能达到目标。
因此,在GIS应用中,对于栅格数据的处理、存储、分析和使用成为研究关注的重点[5-6]。
关于矢量数据栅格化的问题,国内外学者开展了相关研究。
杨存建[7]和程结海[8]探讨了不同栅格大小下,各种土地利用类型在转化过程的面积和精度损失。
杨存建,张增祥对各种土地利用类型在转化过程中的精度损失与栅格大小和平均斑块大小之间的关系进行了定量分析,并以模型来表达[1]。
刘明亮,唐先明研究了1km格网土地利用/土地覆盖数据空间尺度转换(粗化为4km、8km和10km)过程中的面积误差分布特征[9]。
廖顺宝[10]和廖一兰[11]则基于1km格网反映某地区人口密度及其分布的空间变化。
在这些研究中,矢量数据栅格化方法是传统的面积最大值法(RuleofMaxi2mum,RMA),即由在格网单元中占面积比例最大的源区域的属性值来决定整个格网单元的属性值。
很明显,RMA栅格化是一个伴随有属性信息损失的过程[12]。
针对上述问题,中科院地理科学与资源研究所资源环境科学数据中心,利用遥感解译TM影像获取的1∶10万土地利用矢量数据,生成了无属性信息损失的1km×1km土地利用格网产品[13]。
收稿日期:2009-09-17;修回日期:2010-04-28.基金项目:资源与环境信息系统国家重点实验室自主研究课题———地球科学数据质量评价研究;中国科学院地理科学与资 源研究所创新三期领域前沿项目(地球信息方法论体系)课题———地学数据空间化误差评价方法及案例研究。
作者简介:白燕(1985-),女,硕士研究生,研究方向:GIS与遥感应用。
Email:baiy@lreis. 386 地球信息科学学报                   2010年 然而,目前还没有文章对无属性信息损失的矢量数据栅格化的方法进行全面的介绍。
因此,本文将以2005年全国1∶25万土地覆被矢量数据为例,详细介绍一种矢量向栅格转换过程中,没有属性信息损失的方法,即依据“在一个单元格网中,一种土地覆被类型表达为一个栅格图层”的原则,在Arc2GIS支持下,提取出各种土地覆被类型在单元格网中所占的成数,采用POLYGRID命令及其{LOOK2UP_TABLE}INFO文件,将其转化为1km分辨率的格网数据,实现面积信息无损的转换,以期为相关研究人员处理和分析地理空间数据提供新的思路,为空间尺度的应用研究注入新的元素。

2 矢量数据属性信息无损栅格化的研究思路   本研究在ArcGIS支持下,以全国1∶25万土地覆被矢量数据信息无损栅格化为研究思路(如图1所示),即依据“在一个单元格网中,一种土地覆被类型表达为一个栅格图层”(OneGrid,OneType)的原则,利用POLYGRID命令及{LOOKUP_TABLE}INFO文件进行矢量向栅格的转换的方法,通过提取每个地类在1km×1km格网大小内所占的比值为栅格单元VALUE值来产生全国25个土地覆被类型的25个GRID,这样,就可以保证每个地类在每个栅格单元中的属性信息没有损失。
该过程中两个关键操作就是UNION和POLYGRID,其难点则在于如何建立{LOOKUP_TABLE}INFO文件。

3 矢量数据属性信息无损栅格化的实现 311 土地覆被数据本研究所用的基础数据是在“国家科学数据共 享工程———地球系统科学共享网”的经费支持下,由中国科学院地理科学与资源研究所、中国科学院遥感应用研究所等8个单位,共同完成的2005年全国32省、自治区(包括台湾,且将香港、澳门特别行政区的数据归并到广东省)1∶25万的土地覆被矢量数据,其投影方式为Albers正轴等面积双标准纬线圆锥投影;坐标系为Krasovsky坐标系;第一标准纬线:25°N;第二标准纬线:47°N;中央经线:105°
E。
该土地覆被遥感分类系统是针对中国土地覆被实 图
1 属性无损栅格化模式Fig11 Therasterizingpatternthatwithoutattribute informationloss 际情况,在联合国粮农组织提出的LCCS(LandCov2erClassificationSystem)土地覆被分类体系和中国科学院环境数据库土地利用分类体系的基础上,从遥感制图角度和陆地生态系统观点出发而建立的一种新土地覆被遥感分类体系[14],包括6个一级分类和25个二级分类(表1)。
312 土地覆被数据属性信息无损栅格化的实现考虑数据量的大小及处理速度等问题,本研究 按省、自治区分别进行无属性信息损失的栅格化,其中,对于地理区域范围较大的省(如新疆、西藏等),在栅格化的过程中需要进行二次“分块”分别作栅格化处理。
本文采用的软件环境为ArcGIS和Arc/InfoWorkstation,其具体实现过程如图2所示。
AML伪代码如下:
(1)公里格网生成分别创建与全国32省地理空间范围相同的1km×1km格网,同时创建全国范围大小的公里格网(由于数据量太大,需要分几块创建),并定义与土地覆被数据相同的投影,同时建立其拓扑关系生成polygon。
generateFISHNET_NAMEprojectdefinecoverFISHNET_NAMEcleanFISHNET_NAME
(2)叠加(OVERLAY)操作将各省的土地覆被数据与相应的公里格网进行UNION操作,在UNION后生成的Coverage属性表中添加一个字段RATIO(保留两位小数),用来存储不同土地覆被类型在每一个格网中所占的面积 3期 白 燕等:矢量数据属性信息无损栅格化的实现方法———以全国1∶25万土地覆被数据为例   38 
7 比例(百分比)。
unionFISHNET_NAMECOVER_NAMEUNION _NAMEadditemUNON_MAME.patratio1616n2 表
1 基于陆地生态系统特点的遥感土地覆被分类系统Tab11 Theremotelysensedlandcoverclassificationsystemthatbasedonterrestrialecosystemcharacteristics 一级类型二级类型编号 含 义 森林 常绿针叶林11郁闭度>30%,高度>2m的常绿针叶天然林和人工林 常绿阔叶林12郁闭度>30%,高度>2m的常绿阔叶天然林和人工林 落叶针叶林13郁闭度>30%,高度>2m的落叶针叶天然林和人工林 落叶阔叶林14郁闭度>30%,高度>2m的落叶阔叶天然林和人工林 针阔混交林15郁闭度>30%,高度>2m的针阔混交天然林和人工林 灌丛林 16郁闭度>40%,高度>2m的灌丛和矮株 草地 草甸草地 21覆盖度>30%,以草本植物为主的各类草地 典型草地 22覆盖度在10%~30%,以旱生草本为主的草地 荒漠草地 23覆盖度在5%~10%,以强旱生植物为主的草地 高寒草甸 24覆盖度在>20%,以高海拔寒生植物为主的草地 高寒草原 25覆盖度在>20%,以高海拔旱生植物为主的草地 灌丛草地 26草地中灌丛覆盖度<40%,灌丛高度<2m 农田 水田 31有水源保证和灌溉设施,在一般年景能正常灌溉,用以种植水稻、莲藕等水生农作物的耕地,包括实行水稻和旱地作物轮种的耕地 水浇地 32有水源和灌溉设施,在一般年景不能正常灌溉的耕地;以种菜为主的耕地;正常轮作的休闲地和轮歇地 旱地 33无灌溉水源及设施,靠天然降水生长作物的耕地 聚落城镇建设用地41包括城镇、工矿、交通及其他建设用地 农村聚落 42包括农村居民点、定居放牧点等 沼泽 51植被覆盖度高的湿生草地以及地势平坦低洼、排水不畅、长期潮湿多积水,且表层生长湿生草本植被的草地 湿地、水体近海湿地 52各种近海及海岸的海涂、珊瑚礁、红树林沼泽等 内陆水体 53陆地上各种淡水湖、咸水湖、水库及坑塘、河流 河湖滩地 54河流沿岸或湖泊周边的滩地,包括边滩、心滩等 冰雪 55冰川、永久积雪(雪被) 荒漠 裸岩 61地表以岩石或石砾为主、植被覆盖度在5%以下的荒漠及戈壁、裸露石山等无植被地段 裸地 62地表为土地、植被覆盖度在5%以下的裸土地、盐碱地等无植被地段 沙漠 63植被覆盖度在5%以下的沙地、流动沙丘   
(3)不同地类属性表的编辑在经UNION生成的Coverage上,提取出不同 的土地覆被类型在每个栅格单元中所占的面积比,并将同一单元格网内的同类地物的比例相加,并转换为INFO文件,同时添加一个整型字段CODE,将其化为整数。
dbaseinfoCOVER_11.DBFCOVER_11.DATA   //将11类的属性表转为INFO文件 additemCOVER_11.DATAcode1616n   //为INFO文件添加存储整型值的字段
(4)GRID图层生成分别将各省的公里格网的属性表与由.dbf文件转换生成的INFO表进行JOINITEM操作,并根据其ID进行升序排序,生成转换时所需的{LOOKUP_TABLE}INFO文件。
以各省公里格网为基础图层,借助于已生成的{LOOKUP_TABLE}INFO文件,将全国32个省各种土地覆被类型进行POLY2GRID的转换。
同时,对全国范围分块的公里格网进行转换,得到全国范围分块的GRID。
joinitemCOVER_11.PATCOVER_11.DATA 388 地球信息科学学报                   2010年 图
2 技术路线图Fig12 Thetechnicalflowchart COVER_11.DATCOVER_11-ID SORTONCOVER_11-ID polygridCOVER_11COVER_11grdCOVER_11-IDCOVER_11.DAT //32省各地类GRID polygridCHINA1CHGRD1   //全国范围分块   GRID
(5)拼接,包括两层含义,其一是地理区域范围较大的省(如新疆、西藏等)的各种地类的省内拼接,其二是全国32省各种地类的省际拼接。
①全国范围分块的GRID进行拼接。
CHGRD=MOSAIC(CHGRD1,CHGRD2,CHGRD3,......,CHGRDN)CHINA=CHGRD30 ②省内/省际相应地类的拼接:如果原始矢量数据中不存在省界连接处有误的情况,先将32省的所有地类GRID分别插入到全国范围的GRID中,然后,将具有全国范围的32省中对应的地类进行拼接,得到全国25个地类的25个GRID。
对于地理区域范围较大的省内分块地类GRID的拼接,方法也是相同的。
gridinsertCOVER_11grdCHINACOVER1_11   //CHINA为全国范围的GRID CN11=COVER1_11+COVER2_11+COV2 ER3_11+COVER4_11+......+COVER32_11③对于原始矢量数据在省界连接处有问题的 情况,可以生成一个“纠正”GRID,首先,找出省界连接有误的省份,然后在各省连接有误区域生成 3期 白 燕等:矢量数据属性信息无损栅格化的实现方法———以全国1∶25万土地覆被数据为例   38 
9 1km×1km大小的格网,并将其转为GRID,然后,插入到全国范围大小的GRID中,其栅格单元值的确定原则是:省界连接有误区域的值为
1,其他为
0。
这样就可以以“纠正”GRID为条件,对全国25个GRID进行改错处理。
这是一种局部处理,即仅对有误区域进行改错,其他区域栅格值保持不变。
polygridRECTIFY_NAMERECTIFY_GRID gridinsertRECTIFY_GRIDCHINARECTIFY_ GRDRECTIFY=con(RECTIFY_GRD<>0,
1,RECTI2 FY_GRD)CHINA_11=con(RECTIFY==
1,CN113110 310000/CHINA_ALL,CN11)
(6)后处理,包括以下两个内容:①对全国25个GRID进行取整,以便节省存储 空间。
CN05_11=int(CHINA_11+0.5)②对全国25个GRID进行NODATA处理,即将国界外的栅格值处理为NODATA而不是
0,以符合实际情况。
CHINA05=CN05_11+CN05_12+CN05_13+...+CN05_63 //25个土地覆被类型grids相加 CHINA2005=setnull(CHINA05==
0,CHINA05)CONGRD05=con(CHINA2005<>0,
1,CHINA2005) //CHINA2005是“纠正”处理后得到的全国 土地覆被的GRID,CONGRD05为进行NO2DATA处理的条件GRID。
CHINA05_11=CN05_113CONGRD05通过上述过程即可将土地覆被矢量数据无属性信息损失栅格化。
图3是2005年北京市1∶25万土地覆被类型矢量数据,根据分类系统北京市共有15个土地覆被类型,图4显示的是采用面积最大值法生成的栅格GRID,图5是利用无属性信息损失栅格化方法生成的15个栅格GRID。

4 实验结果分析 矢量和栅格是GIS应用中两种基本的地学数据格式。
与矢量数据相比,栅格数据不仅利于空间分析,而且栅格是空间尺度分析应用中常用的数据格式。
传统的面积最大值法进行矢量数据向栅格数据的转换存在属性信息损失,其主要原因就在于如果在一个栅格单元大小内仅有一种土地覆被类型,那么转换后单元格的值为该地类的代码值;但 若一个单元格内存在混合地类,转换后单元格网值就是单元格内所占面积最大的地类的代码值,这就意味着其他面积比较小的地类就不予考虑、忽略了,从而存在属性的转换误差。
本研究依据“在一个栅格单元中,一种土地覆被类型表达为一个栅格图层”的原则,详细介绍了一种结合使用POLYGRID和{LOOKUP_TABLE}INFO文件进行矢量数据栅格化的方法。
通过与传统栅格化 390 地球信息科学学报                   2010年 图5 2005年北京市土地覆被无属性信息损失栅格化结果图Fig15 RasterizationresultoflandcoverinBeijing(2005)thatwithoutattributeinformationloss 方法的比较,证实了本文所介绍的方法的无属性信息损失性。
如图
6,在经UNION后生成的ID号为6705的COVERAGE中包含有4种地类,分别是14—落叶阔叶林、32—水浇地、41—城镇建设用地、42—农村聚落,其面积分别为4473123m2、881618105m2、58260122m2、55648150m2,所占面积百分比(RATIO)分 别为0145%、88116%、5183%、5156%。
如果使用传统的栅格化方法,利用POLYGRID命令来进行土地覆被矢量数据到栅格数据的转换,只会得到一个GRID图层。
若将POLYGRID命令和{LOOKUP_TA2BLE}INFO文件结合使用,则会生成4个GRID图层(14类,32类,41类,42类),其ID均为6705,且对应格网的Value值分别为:45,8816,583,556。
图6显示出了两种栅格化方法的不同。

6 两种栅格化方法的对比Fig16 Contrastoftworasterizingmethods
5 结论 本研究以全国1km×1km土地覆被栅格产品的生成为例,介绍了一种矢量数据无属性信息损失栅格化的方法,该方法可为相关研究人员在今后处理和分析地理空间数据的工作中提供新的思路,为空间尺度的应用研究提供有价值的参考;也可以用相同的方法生成不同栅格大小的系列产品,如2km ×2km,500m×500m等,但栅格单元大小为1km的 3期 白 燕等:矢量数据属性信息无损栅格化的实现方法———以全国1∶25万土地覆被数据为例   39 
1 栅格数据精度上已能满足全国尺度研究的需要。
至于1∶25万土地覆被矢量数据转换为栅格数据工作中,栅格单元的CELLSIZE选取多大最为合适,以及选取什么样的标准来评价合适与否,其最佳“适宜尺度”的标准,还有待今后进行深入的研究。
参考文献: [1]杨存建,张增祥.矢量数据在多尺度栅格化中的精度损失模型探讨[J].地理研究,2001,20
(4):417-422. [2]BatesPDandDerooAPJ.ASimpleRaster-basedModelforFloodInundationSimulation[J].JournalofHydrology,2000,236:54-77. [3]DemersMN.GISModelinginRaster[M].NewYork:JohnWiley&SonsInc.,2002. [4]赵磊.土地利用空间数据转换的尺度效应研究[D].中国农业大学,2005. [5]陈述彭.人口统计的时空分析[J].中国人口·资源与环境,2002,12
(4):3-
7. [6]陈述彭,陈晓秋,周成虎.网格地图与网格计算[J].测绘科学,2002,27
(4):1-
6. [7]杨存建,刘纪远,张增祥,等.土地利用数据尺度转换的精度损失分析[J].山地学报,2001,19
(3):258-264. [8]程结海,魏峰远,薛华柱.空间数据尺度转换方法与应用[J].地理空间信息,2008,6
(4):13-15. [9]刘明亮,唐先明,刘纪远,等.基于1km格网的空间数据尺度效应研究[J].遥感学报,2001,5
(3):183-190. [10]廖顺宝,孙九林.基于GIS的青藏高原人口统计数据空间化[J].地理学报,2003,58
(1):25-33. [11]廖一兰,王劲峰,孟斌,等.人口统计数据空间化的一种方法[J].地理学报,2007,62(10):1110-1119. [12]CarversSJandBrunsdonCF.VectortoRasterErrorand FeatureComplexity:AnEmpiricalStudyUsingSimulated Data[J].InternationalJournalofGeographicalInformationSystems,1994,8
(3):261-270.[13]徐新良,庄大方,张树文.基于3S技术的土地利用/土地覆盖变化野外采样框架设计———以东北地区黑龙江省为例[J].遥感技术与应用,2002,17
(3):135-139.[14]张增祥,汪潇,王长耀,等.基于框架数据控制的全国土地覆盖遥感制图研究[J].地球信息科学学报,2009,11
(2):216-224. ImplementMethodofVectorDataRasterizationThatwithoutAttributeInformationLoss:ACaseStudyof1∶250000LandCoverDataofChina BAIYan1,
2,LIAOShunbao1 (
1.StateKeyLaboratoryofResourcesandEnvironmentInformationSystem,InstituteofGeographicSciencesandNaturalResourcesResearch,CAS,Beijing100101,China;
2.GraduateUniversityofChineseAcademyofSciences,Beijing100049,China) Abstract:VectorandrasteraretwobasicformatsofgeospatialdatausedinGIS.Rasterdataaremoresuitableforspatialmodelingandspatialanalysisthanvectordata,moreover,rasterizationhasefficacyofscalingtosomeextent,andrasterdataisthemajorformatusedintheapplicationofspatialscalinganalysis.Inmostcasesvectordataoflargescalesaresubjecttoinformationsecurityandintellectualpropertyprotection.Thesedatacanbesharedmorepubliclybecausetheirspatialresolutiondecreasesafterrasterization.Asthetechnologiesofgeospatialinformationcollectionimprovedincreasingly,rasterdatahaveethemostdominantformatofdatasourcesingeosciences.However,traditionalrasterizingmethodisaconversionprocesspaniedwithattributeinformationloss,themainreasonofwhichis“varioustypesexistinginonegrid”.Inviewofcurrentproblemsinprocessofrasteriza2tion,takingrasterizationoflandcoverdataofChinaatascaleof1∶250000asacasestudy,thispaperputsforwardaconversionmethodbasedongridcell,thatisontheprincipleof“onelandcovercategoryonegrid”,2binesPOLYGRmandwithits{LOOKUP_TABLE}INFOfilesinthesoftwareenvironmentofArcGIS,soastoguaranteenoinformationlossinthewholeconversionprocess.Moreover,thestudycanprovideanewinsightandanewideaforcorrelativeresearcherstodealwithandanalyzegeographicalspatialdatasets,aswellassupplyvalu2ablereferencesforthescientificworkofspatialscalinganalysis. Keywords:vector;noattributeinformationloss;rasterization;method

标签: #crs #文件格式 #cj #click #什么用 #cpk #服务器 #文件