地理本体的研究进展与分析(1)

摘要:地理本体地理信息科学中的一个新兴的和正在发展的研究领域,从提出至今仅有10 年的历史。代写论文 因此,有重点系统分析地理本体研究的发展历程与进展,对中国在此方面的研究定位具有重要意义。文章在深入分析科学领域本体定义基础上,进行了地理本体定义,探讨了地理本体研究意义,列举了国际上与地理本体相关的主要计划与学术会议,详细剖析了当前国内外的地理本体理论研究与应用方面取得的进展。地理本体研究已成为国际GIS 领域一个重要的新兴研究方向并得到了蓬勃发展,而国内在这方面的研究才刚刚开始,只有少数学者开展了一些探索性的思考和研究。因此,中国应紧跟国际地理本体研究动态,积极开展我国自己的地理本体理论、方法和应用研究。关键词:本体论;地理本体;语义;语义互操作;信息共享人类世界几千年的文明历程,创造了一个十分庞大、丰富的客观知识世界,波普尔称之为第三世界(World 3) [ 1 ] 。随着科学技术的发展,知识共享、重用的需求,迫使人们对人类所共同拥有的知识、信息与数据进行本体重建和网络共享,及计算机协助整合。地理知识、信息与数据是客观知识世界的重要组成部分,因此地理本体研究本体重建重要的基础之一。本体研究不仅是方法与工具,也是一种科学思想与理论

地理本体地理信息科学的一个新兴的研究方向,对其的发展进行综合分析,为其进一步向前发展打下良好基础。本文从本体论出发,着重分析地理本体重建的发展及研究现状,提出今后的研究重点与建议。1  本体研究概况Ontology 原本是一个哲学基本问题,指关于存在及其本质和规律的学说,后被用于研究实体存在性和实体存在的本质等方面的通用理论。计算机界借用这个理论,把现实世界中某个领域抽象或概括成一组概念概念间的关系,构造出这个领域本体。在近年来,Ontology 不但在哲学领域[2 ] ,而且在自然科学与工程技术领域中备受关注,正逐步成为这些研究领域共同关注的一个核心问题[3—5 ] 。Ontology 在科学技术领域兴起的最主要原因是,语义互联网、语义建模和语义集成需要Ontolo—gy 作为支持发展的基础理论。虽然Ontology 的出现频率较高,其中文相对应的词却很不统一,国内许多学者就Ontology 的一词的译法和意义进行了深入的探讨,比较公认的译法是ontology 为“本体”和Ontology 为“本体论”[ 6—10 ] 。本文中采用本体论与本体的译法。哲学中的本体论与现代科学技术中的本体论之间有着非常紧密的联系。哲学本体论是科学本体论的基础,哲学本体论对科学本体论具有重要的指导意义。笔者认为:本体论可分为哲学本体论与领域本体论。本文在此不对哲学本体论做深入分析,重点是地理信息的领域本体,即地理本体论。 论文代写 一个最基本的概念达成共识,对于相互交流和深入研究非常重要。由于本体论在科学技术领域中是一个新事物,研究人员在其定义与涵义的理解方面还存在差异。代写毕业论文 据有关学者分析,Ontology 在科学与技术领域最早出现于1984 年,明确提出且进行定义是在1991 年[7 ,11 ] ,从此对Ontology 的定义日渐丰富[12—23 ] (见表1) ,但基本上是大同小异,不存在本质方面的区别和争议。笔者根据研究人员的不同定义进行分析后,认为作为一个思想、理论和方法,它的概念包括四个主要方面: ①概念化,客观世界的现象的抽象模型,把领域的知识抽象为一个个确定的对象; ②明确的定义,对每一个对象的概念及它们之间联系都进行合理地定义; ③形式化,需对概念及它们之间关系进行精确的数学描述且要达到计算机可读的水平; ④共享,本体中反映的知识是其使用者(包括该领域的专家和一般用户) 共同认可的。上述定义表明,由客观世界某一领域的事物或现象的本质(即本体) 到人们对这些事物或现象的本质通过认识活动所形成的认识结果(即概念体系) ,再从概念体系到人们用特定的符号系统或语言将某一概念体系做出明确的、形式化的表示或表达,总共涉及了三个层面的东西。因为这三者之间具有联系,应该具有一致性或统一性, 可以统称为“本体”[ 6 ] 。 论文网 本体论思想被应用到科学技术领域时,就是要把现有的知识、信息与数据采用面向对象的形式还原成一个合理的语义体系,使计算机能够处理,使人们能够共享。地理本体是一个特殊领域本体,它具有一般领域本体的基本共性,也有其独特之处。表1  本体的各种定义[ 12—23]Table 1 Definitions of ontology作者(时间) 本体定义Neches 等(1991) 本体是组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则Gruber (1993) 本体概念化的明确规范说明Guarino 等(1995) 本体概念化的、明确的、部分的说明/ 一种逻辑语言的模型Uschold (1996) 本体概念化的、明确说明和显式表达Borst (1997) 本体是共享的、概念模型的与形式化的规范说明Swartout (1997) 本体是一个为描述某个领域,而按继承关系组织起来作为一个知识库的骨架的一系列术语Studer (1998) 本体是共享的、概念化的、显式的与形式化的规范说明Fensel (2000) 本体是对一个特定领域中的重要概念共享的形式化描述Noy F. N. (2001) 本体是对某个领域中的概念形式化的明确表示,每个概念的特性描述Fonseca (2001) 本体是以某一观点用详细明确的词汇表描述实体、概念、特性和相关功能了概念的各个方面及其约束的特征和属性的理论 Starla (2003) 本体必须包括所使用术语的规范说明、决定这些术语含义的协议、以及术语之间的联系,来表达概念2  地理本体论的定义研究意义2.1  地理本体定义地理本体就是把有关地理科学领域的知识、信息和数据抽象成由一个个具有共识的对象(或实体) ,代写硕士论文 并按照一定的关系而组成的体系,同时进行概念化处理和明确的定义,最后以形式化表达的理论与方法。2.2  地理本体研究意义地理本体地理信息科学领域受到广泛关注,其重要性已在许多方面得于表现,如知识工程、数据库设计和集成、信息检索与获取、软件工程等,实现世界范围的知识级信息集成。地理信息系统技术的发展,推动各种系统与数据库的建设,进行了大量的数字生产,随着高性能网络普及,信息共享与互操作变得越来越重要。因此,必须由原来的数据建设转变为数据与地理本体建设并重。 地理本体研究可以为以下几个主要方面提供重要的理论与方法支撑:(1) 语义互联网:语义互联网提出后发现必须定义好底层的领域本体才可能顺利构造出语义互联网。语义互联网的基础就是本体,为使计算机能够理解,必须用形式化本体定义互联网资源中的数据和元数据的意义。地理信息资源作为语义互联网的重要资源,如何融入语义互联网是地理信息科学的重要课题。地理本体的抽象与构建是其重要基础。怎样让地理数据与信息在全球信息网格上运行,地理空间数据定义共享和互操作需要借助本体数据库思想建立一个统一的语义网络,来描述同一个客体在不同专业空间数据库中的语义描述及其转换[10 ] 。 (2) 地理信息系统之间的语义互操作:实现地理信息资源共享与互操作地理信息技术发展的一个重要方向。从信息观点看,为了实现互操作,两个系统必须是信息模型可互操作,为了实现信息模型互操作,两个系统必须在语法上和语义上可互操作。语法互操作是指两个系统流动和被处理的信息使用相同的结构,这个问题已基本解决。语义互操作是指两系统对其中流动和被处理的信息有相同的语义理解[ 24 ] 。语义互操作问题才开始引起研究人员的重视,是今后的研究重点。(3) 知识级地理信息共享与知识重用:随着大量地理知识、信息与数据的丰富和GIS 与互联网技术发展,实现信息、数据和知识的共享是完全可能的。由于主体(人) 对客观地理事物的认识存在较大差异,经常造成可能共有,但不能真正的共享与重用。例如对土地覆盖分类数据,不同国际组织、不同国家、不同部门和不同群体等具有不同的认识,并按照各自的认识进行数据生产和信息提取,造成相互之间的交流与实质性共享和重用非常困难[25 ] ,为此国际上也召开专题协调会议[26 ] 。因此,在某些地理领域抽象一个合理和共识性地理本体是非常重要的,同时建立不同认识之间的语义映射机制也是非常必要的。(4) 地球科学中语义建模:在对地球系统的过程进行建模时,需要ontology 的辅助使得不同领域的模型能够互相交互、重用和共享。在描述这些过程时,需要将过程的行为、时空特性与其他过程的关系等等描述出来。这些过程描述的集合构成一个过程库,称为模拟框架的基础。在地球系统建模中使用和表达语义将增强人们对环境系统进行科学研究和考察的能力,语义网为我们描述的各种解决方法提供平台和模型以及模型结果的使用带来新的有趣的途径[27 ] 。

论文代写 3  地理本体研究现状从20 世纪90 年代末开始,本体概念及其思想引起了地理信息科学研究者的注意,许多国际学术组织和研究机构开展了一系列相关研究计划,地理信息科学界的许多国际学术会议也设立了与本体相关的讨论主题。在地理本体基础理论研究方面,主要对地理本体理论构成、地理本体的人文调查与实验研究地理本体的信息学研究,代写医学论文 特别是地理本体形式化描述语言和工具及本体创建和集成方法等方面进行了广泛而深刻的思索与探讨,并将地理本体理论与方法研究成果应用于地理信息集成、地理信息检索、道路寻找和智能体系统设计与开发、社会及生态环境研究等多个应用领域。下面首先简要介绍国际上开展的一些地理本体研究计划及召开的一些相关学术会议,然后从基础理论和应用两个方面介绍地理本体研究进展。3.1  国际上与地理本体相关的主要研究计划与学术会议(1) 国际上主要的地理本体研究计划:科研人员针对某一个科学问题进行深入研究经常是通过有计划和目标的研究计划与项目,同时也反映出此科学问题得到科研人员的重视和具有重要的学术价值。地理本体的计划主要集中在美国,也逐渐在欧洲得到重视(表2) 。 论文代写 (2) 地理本体相关的主要国际学术会议:在国际信息科学领域会议中,特别是空间信息与地理信息科学的会议,开设地理本体或时空本体的讨论专题(表3) ,代写职称论文 表现为关注地理本体的科研人员越来越多和需要交流的科学问题很多,这也表明此学科正在发展。3.2  地理本体基础理论研究进展地理本体基础理论研究主要探讨地理本体理论构成及地理本体的构建方法等方面,代写英语论文 即从科学理论的视角来看,地理本体理论应包括哪些基础理论、需要应用哪些科学工具、存在哪些地理本体的构建方法。由于认知科学现有的以桌面空间现象为基础的分类理论并不适合于地理对象,必须发展新的地理空间本体基础理论[28 ] 。因此,有些学者就地理本体基础理论构成问题提出了一些建议。Smith 和Mark 认为,针对地理对象的复杂性及由许多部分组成的特征,地理本体理论必须包括部分2整体理论(Mereology) ;针对地理对象具有边界且地理对象之间存在相接、相离、相交以及封闭和开放等拓扑特征,地理本体理论也必须包括拓扑学理论;由于常规拓扑学可能不能解决一些复杂的地理边界现象,地理本体还应包括纯拓扑理论(Me—reotopology) ;此外,地理本体研究必须说明地理对象的维度以及各种空间关系,也需要几何学作为其基础理论之一;除了上述数学理论外,由于许多地理对象的分类和地理现象的存在与人类的认知行为、语言和文化相关,地理本体理论也应该将认知科学和人文科学的调查和实验研究纳入到其基础理论体系中[28 ] 。为了便于在部分2整体理论基础上研究地理实体与该实体所处空间区域的关系,除了部分2整体理论和拓扑学理论工具外,地理本体理论还应包括一般空间定位理论(A general t heory of spatial location) 这种地理表达工具[29 ] 。而有的学者则进一步强调地理本体应在内涵上定义并用形式化语言以计算机可以理解的方式表示拓扑理论、部分2整体理论、识别理论、分类理论和依赖理论( Theory of dependence) ,只有基于上述理论发展起来的地理本体才有助于建立语义上更加一致的地理空间信息模型[30 ] 。由此可见,地理本体基础理论构成应包括地理信息科学中相关的理论工具,如拓扑学理论、部分2整体理论、几何学和纯拓扑理论等数学工具,以及地理哲学、地理分类理论地理认知科学或认知心理学、人类学和语言学等诸多学科。 论文代写 表2  国际上主要的地理本体研究计划Table 2 Majoroversea research project s on geo—ontology计划名称资助机构空间知识的本体等级体系(1995) 美国国家科学基金会(下称:NSF)地理类型的本体调查(1999)NSFNSF2CNPq 地理空间信息集成合作研究(1999) NSF与巴西国家空间研究所( INPE)数字政府:地理空间知识本体(1999)NSF 的“数字政府”项目数字政府:地理空间知识的表示与分发(2000)NSF 的“数字政府”项目空间思考与推理(2003)NSFIGERT :地理信息科学综合培训计划(2003) NSF地理本体研究组ONTOGEO 希腊雅典国家技术大学乡村与测量工程学院语义互操作实验室(MUSIL) 德国Munster 大学地理信息科学研究表3  国际上地理本体相关的主要学术会议Table 3 Major international conferences on geo—ontology时间会议名称1998 年第一届国际形式化信息系统本体会议( FOISp98)1998 年第八届空间数据处理国际研讨会(SDHp98)1999 年“场本体( The Ontology of Fields) ”的专家会议1999 年国际空间信息理论大会(COSITp99)2000 年第一届国际地理信息科学大会( GIScience2000)2001 年国际空间信息理论大会(COSIT 2001)2002 年第二届国际地理信息科学大会( GIScience2002) 毕业论文 2002 年由英国陆军测量局与利兹大学联合组织“地理本体论研讨会(Workshop on Geo—On—tology) ”2003 年国际空间信息理论大会(COSIT 2003)2004 年第三届国际地理信息科学大会( GIScience2004)2005 年时空建模、空间推理、空间分析、数据挖掘与融合国际会议(STMp05)地理本体构造方法研究目前有三个主要研究方向,即本体研究方向、人文调查与实验研究方向和信息学研究方向。这三个研究方向的研究方法和侧重的研究内容各不相同,是地理本体理论相互补充、相互约束的三个方面, 而不是相互对立和排斥的[31 ] 。(1) 地理本体研究:代写留学生论文 地理本体研究主要从哲学角度探讨地理本体的构成方法方面的研究,即试图在不同尺度和粒度层次上建立构成地理空间领域的各种对象、过程和关系等的所有类型,并形成等级体系。这种研究方法目前主要包括两个方面:与领域科学家进行交流,以设计建立各个领域内所有实体的种类;发展组织这些实体种类,例如部分2整体关系和粒度等的形式化方法。第一方面的研究很难综述,但很显然地理科学领域已经建立了很多分类系统和标准,如地貌学中各种地貌的分类系统等。但这些分类系统的合理性和科学性评价方面的研究还相对滞后。Chrisman批评了那种发展大一统的地理本体的做法,认为应该保留对现实世界的不同看法,发展可以集成并转换各种分类系统以及解决这些不同分类系统之间语义异质性的科学方法可能是一个比较合理的研究方向[32 ] 。 论文网 实体类型的组织目前主要采用各种等级结构进行。树状结构是目前组织实体类型的主流方法,其特点是各种实体类型根据其一般性程度被划分到某个一般性层次上,而且每个类型只有一个父类但可以有多个子类,这种本体的典型代表就是Word—Net 。Kuhn 从认知科学中的概念集成思想出发探讨了地理类型的语义建模,揭示了像WordNet 这种以树状结构或概念等级组织的本体的优势和缺陷,认为其优点在于可以基于概念之间的距离来度量它们之间语义的相似性,而其缺陷一方面表现在这种本体只具有单一的继承关系,另一方面表现在这种结构不能抓住概念之间的某些关系,如概念的功能关系,而以代数视图为基础的Haskell 语言被证明是改进这些缺陷和构建本体的有力工具[33 ] 。此外,形式化概念分析方法及概念格允许多态继承,克服了树状结构的固有缺陷,也是组织本体的有力工具[34—35 ] 。(2) 地理本体的人文调查和实验研究:地理本体的人文调查和实验研究主要采用心理学或认知科学的调查和实验检验方法,研究普通人群对基本地理概念的理解,或参考朴素地理学或民间地理研究成果,从中抽取地理本体,为地理本体的建立提供经验和实验基础。Smith 和Mark 等在此方面进行了的一系列实验研究工作。他们认为并假设地理对象不仅仅位于空间中,而且在本质上与空间相连,从空间继承了其结构特征,地理类型也往往是与大小或尺度相关的,而且地理事物或事物类型可能与个人或文化差异有关。为了验证这种假设,他们设计了一系列实验,包括:为某些地理类型抽取类型范本的实验;类型实例及其属性和组成部分实验;边界本质问题实验;术语定义实验。这些实验都以人为实验对象,通过问卷调查及调查结果的统计分析来研究地理概念的认知方面,从而为地理本体建立经验基础。这些实验数据揭示了这样一个事实:地理科学家和普通人群对于术语“地理”和“地理的”的涵义的理解存在很大的差别,因此地理科学家实际上研究的并不是民间普通人群概念中的地理现象[36—38 ] 。他们的系列实验仍在进行中,并希望通过在不同地区、不同文化和不同语言背景下分别进行实验,以验证这些差异是否会明显影响人们对基本地理概念及其本体的理解。在澳大利亚一个部落土著语言中的景观元素类型与英语比较研究之后发现,这两个系统间在基本层次上就存在本质差异,表明地区和语言文化背景差异确实会对人们头脑中的基本地理概念及其本体产生明显影响[39 ] 。

(3) 地理本体的信息学研究:地理本体的信息学研究采用信息科学的标准研究模式,研究地理本体的描述、获取、比较和集成方法以及有关的形式化表达工具,以实现互操作和跨系统转换及地理信息(数据) 的集成与检索。本体集成和形式化研究是人机智能等计算机领域本体研究中的一个重要研究内容,目前已经发展了许多本体形式化语言和方法。概括而言,目前本体形式化语言主要有两大类,即基于框架的表示语言和描述逻辑,经典的基于框架的表示语言包括Ontolingua 、O KBC 等;描述逻辑在人机智能特别是知识工程领域广为应用,已经发展了多种基于描述逻辑的本体表示语言,如LOOM、OIL 等。在对比分析各种本体定义语言在定义地理信息本体方面的优缺点的基础上,Mota 等认为这些工具各有特点,相对而言Ontolingua 的功能比较强,但也无法完成对行为的合理定义和声明,而且也不可能完整定义一般的推理过程,因此应扩展Ontolin—gua 以便可以完整地定义地理信息本体[ 40 ] 。Visser等对形式化本体及其在地理信息处理中的应用作了一个简洁综述,对各种本体语言的形式化程度进行了比较,包括描述层次的XML 到一阶谓词逻辑层次的概念建模语言CML 以及更复杂、形式化程度更高的知识交换格式KIF 等,并简单介绍了一种基于语义的智能信息检索代理构架[41 ] 。目前,地学领域已经认识到,虽然计算机领域的一般信息本体研究已发展了许多本体形式化语言和方法,但这些形式化工具并不能完整地定义地理本体,必须扩展现有语言和方法或发展新的能满足地理本体需要的形式化工具。为此,已有一些学者就地理本体语言和工具方面提出了一些建议[42—43 ] 。 论文网 地理本体并不是无源之水,地理研究已经形成了许多文本形式的地理领域本体,如各种分类体系及地理空间概念模型等。因此,可以发展从自然语言文本中抽取生成地理本体的方法,以便充分利用地理学现有的研究成果。Kuhn 提出了一种从自然语言文本中抽取地理领域本体的方法,该方法主要关注文本中的对象行为,并以从德国交通代码文本中抽取汽车导航领域本体为例说明了这种方法的可行性[44 ] 。不同的信息领域对相同地理现实具有不同的观点,因此存在许多不同的分类系统。相同领域中这些不同的分类系统和标准之间是互补的,不同的分类系统表达了同一领域的不同方面,可以在一个顶级本体的框架下,应用形式化概念分析方法,将这些分类系统与顶级本体进行集成和融合,从而产生集成的概念格,这样一方面既可以保持各个分类系统的独立性,更重要的是又可以产生比较完整的领域本体,实现不同分类系统之间的转换和互操作。基于这种思想, Kokla 等以CYC 顶级本体、WordNet和SDTS (USGS 的空间数据转换标准) 本体中的“河流”概念为例,应用形式化概念分析方法,通过语义因子分解和建立概念格(Concept lattice) 这两个步骤,得到了集成的概念格,验证了这种方法的有效性[45 ] 。Kavouras 等应用形式化概念分析和概念形式化表达地理类型及集成不同地理本体的具体方法[46 ] 。此外,也有学者提出了基于相似性的本体集成方法[47248 ] 。 代写论文 3.3  地理本体应用研究进展目前地理本体的应用研究主要集中在以下四个方面: 代写工作总结 (1) 地理信息(数据) 集成; (2) 地理信息(数据集) 发现与检索; (3) 道路寻找(Wayfinding) 系统研究; (4) 其他应用研究本体作为共享概念模型建模的有力工具,在解决不同数据源之间语义异质性、互操作和集成方面的潜在优势已得到了学术界的广泛重视。在计算机学界,本体方法已经广泛应用于数据集成特别是模式和语义集成方面,有关这方面的研究进展可以参考相关文献[49—51 ] 。 代写论文。

4 次访问