推荐期刊

本体论的水产养殖中知识表示

时间:2015-12-21 01:05:31 所属分类:水产与渔业 浏览量:

随着生活水平的提高和营养健康意识的加强,人们对水产养殖产品的需求日益增加,水产品的安全性日趋成为人们关注的焦点。近年来,养殖、捕捞、加工、运输、销售等过程由于水质污染、养殖用药不规范、加工生产流程不规范、质量管理不严格造成水产品药残超标等

随着生活水平的提高和营养健康意识的加强,人们对水产养殖产品的需求日益增加,水产品的安全性日趋成为人们关注的焦点。近年来,养殖、捕捞、加工、运输、销售等过程由于水质污染、养殖用药不规范、加工生产流程不规范、质量管理不严格造成水产品药残超标等质量安全问题,从而引发了一系列水产安全事件,如硝基呋喃代谢物、孔雀石绿残留、多宝鱼事件等[1]充分暴露出中国水产品质量安全的诸多问题。

为提高消费者对水产品的信心,应准确记录水产养殖生产中的信息和实时监控水产养殖企业的生产环境,为在事件的早期阶段及时发现并采取补救措施提供数据支持[2]。详细真实的日常活动记录是追溯系统的基础,可保证有效实用的供应链管理,而随着时间的增长和企业数量的增加,文档记录量将会非常大,如果用户想从大量的数据中获取到有用的信息将更加耗时,及时预警将更困难。并且水产的品种繁多,养殖流程各异、生产过程中关键控制点不同。不同的生产管理系统采集不同结构的数据,在集成追溯平台和疾病预警系统时信息难以有效共享,同一个概念可能有不同的解释,容易产生歧义与表述不一致等问题。

国外对本体的研究项目很多成果已十分丰富,并且建成了许多正在使用的开源本体知识库系统。国内对此的研究十分有限,与国外存在很大的差距。为满足企业界和学术界的需求,现已开发出了多种通用的常识性本体库系统和大量的领域本体库系统[3],例如Ontolingua本体库,DAML本体库,也有一些公开可以得到的商业本体库,UNSPSC(www.unspsc.org),RosettaNet(www.rosettanet.org),DMOZ(www.dmoz.org)和Swoogle。进入21世纪以来,随着本体论思想在农业信息研究领域的兴起,许多学者都认识到能科学表述并组织领域固有属性概念体系的本体将在农业信息分类、信息/知识库构建等方面具有广泛的应用前景[4];郭永洪[5]在鱼病的诊断推理系统中采用本体构建了鱼病诊断概念模型;齐红[6]采用形式概念分析方法构建了玉米种植本体,研制面向玉米种植的语义检索系统;徐勇等[4]探讨了奶牛业生产经营过程阶段和对应的信息需求单元,构建了奶牛养殖过程本体和奶牛养殖业信息协同服务业务链模型,建立了基于业务链模型的奶牛养殖业信息协同服务系统;但是采用本体论对水产养殖领域的知识进行统一的描述和表示的文献还未见报道。

针对以上系统存在的异构及缺乏共同理解的问题,将本体引入水产养殖生产领域,采用本体论的基本理论和方法,把现实世界中水产养殖领域抽象或概括成一组概念及概念间的关系,可有效解决水产养殖领域的“信息孤岛”和知识共享问题,并可为便捷、准确、高效的信息服务的研究工作提供一定的启示和参考意义。

1本体概述

1.1本体概念

在人工智能领域中一个本体是指用特定的词汇描绘的一个实际存在的事物[7]。而在语义网的范畴内,本体就是关于一个专业领域或知识的共同理解。它定义了用在特定领域的术语,用本体来描述领域知识,能够实现信息资源的语义明确化,为机器理解信息资源语义的提供了媒介。根据本体不同的属性,对本体有不同的分类方式。Gruber[8]根据详细程度和领域依赖度两个指标将本体分为4个类别:顶级本体、领域本体、任务本体和应用本体。

1.2本体的构建方法

目前为止,本体工程中5种比较典型的构造本体的方法论有:骨架法,TOVE法,METHONTOLOGY方法,SENSUS法,七步法,文献[9-10]详细论述并比较了以上建模方法。以上5种方法都是以领域专家为主,主要依靠领域专家的参与,通过严格的过程来构造本体。

2领域本体构建

为了开发本研究的本体,借鉴METHONTOLOGY的框架,并结合面向对象开发方法对其进行了细化,根据构建领域本体的特殊性,对此方法进行了改进。这个方法被分成3个阶段:规范化、概念化和实现,这些阶段组成一个迭代的过程[11],构建过程见图1。本研究使用的方法的创新点在于整个过程由组成每个阶段的任务组成,此外可使用软件工程技术将各个阶段加工。在这个方法学中最重要的是领域概念模型的定义。概念模型从规范化阶段的知识获取开始,知识获取是概念化的基础。为了本体工程师和领域专家的交流本文借助领域专家比较熟悉的软件工程建模工具UML。

2.1规范化

2.1.1知识获取

水产养殖领域涉及生产信息、检测信息、预警信息、疾病诊断和质量安全信息,涉及到多学科的知识。由于每个学科都有自身的特点,并且都具有本学科专有的概念、属性、关系等,同时学科间也存在交义和重叠。所以领域知识的共享、重用是非常必要的。为了准确的获取生产中的知识,把握用户的需求,研究的知识获取采用两种手段,一是对广西、山东、贵州的几家养殖企业进行实地调研,通过对几家企业水产养殖产品从育苗、放养到收获、运输、销售流程的剖析,从养殖品种看养殖的品种20余种左右,日常记录的信息包括生产记录、用药记录、投喂记录、水质记录、捕捞记录等。生产过程中不同的养殖品种采用不同的质量控制措施,具体的养殖过程记录数据也有差别;第二种手段是通过知识工程师与领域专家之间的互相交流来完成的,具体过程如下。

2.1.2确定本体覆盖的领域和范围

明确所构建的本体将覆盖的专业领域,开发该本体的目的、本体中的信息能够回答问题的类型等。该本体主要考虑的是和水产养殖相关的概念,包括水产种类、水产养殖过程相关的概念,同时包含了一些农业生产方面的常用概念和与生产密切相关的通用概念(知识域、农业生产)。下面是本研究构建的能力问题:水产养殖过程都包括哪些活动?水产主要分为几大类?淡水鱼具体都包括那些类?水产品的地区分布是什么情况?罗非鱼、鲢鱼分别属于哪类?它们主要在哪个地区,有什么特征?淡水鱼又分为几类?主要的营养价值是什么?水产养殖的主要投入品包括什么?

2.1.3领域描述

在进行领域描述时,本研究参考国家农业科学数据共享中心的数据库知识和Swoogle中的多个本体,组织农业领域的专家、水产养殖负责人、软件工程师进行领域描述,结果如下:水产品是水产生产的结果,是人类生产活动的结果,同时也是农业信息化系统的研究对象之一。水产品分为不同的种类。水产养殖管理系统:为不同的水产品提供一些基础信息和养殖过程关键控制点,以及一些不同生长阶段的养殖过程记录等。不同种类水产品的繁殖时间。不同种类水产品的营养价值。不同水产品的特性。水产信息管理系统的对象。水产研究的研究对象。在水产品从育苗到销售的整个阶段有一些常用的信息:水产品的分类和消费者的分类,繁殖季节,旺季的价格等。

2.2概念化

2.2.1领域概念模型

UML类图从类的角度表达概念和概念之间的关系,UML类图在确定本体范围和发现领域概念方面是非常有用的,UML类图中的信息是构建本体词汇的基础,尽量借助范化和特有化技术包含其他的概念。图2为使用UML类图表示的领域本体的概念模型其中一部分。本研究在查看已有本体的基础上,并参考有关农业知识表达的一些文献,提取与水产养殖相关的词汇,包括水产品:草鱼、罗非鱼、斑点叉尾鮰、海水鱼、虾类等;与水产养殖过程相关的词语包括:养殖方式、养殖类型、育苗、分塘、捕捞、放养和投喂等,还包括整个养殖过程中可能会发生一些病虫害或者其他的自然灾害,如包含疾病、水产养殖专家、施药、病害防治等,而现在随着信息化的日益普及,水产品的销售渠道也不仅仅限于普通的客户-农民的销售方式,而借助现在的互联网实现网上交易也不是不可能,故需要涉及到水产信息管理系统。

2.2.2定义类、关系和属性

(1)定义类和关系。本体通过上面的核心词汇列表得出本研究的类应该包括:水产品分类(淡水鱼、海水鱼、虾类、蟹类、鲆鲽类),水产的养殖生产过程类(孵化、放养、育苗、分塘、捕捞、水温记录、水质记录、pH记录、投喂记录、池塘),养殖的基础信息(企业、养殖场、品种、饲料、药品)、检测信息(检测单位、检测样品、检出值、检出限)。在“水产品类”和“养殖生产”类之间,通过ObjectProperty属性“HasActObj”来关联,可以设置“HasActObj”的域为“养殖生产过程”,范围为“水产品类”。见图3:一旦层次关系和层次关系的特征确定之后,可以借助用统一的标准指定名称、确定域和范围、基数和逆关系的方法制作反应双向关系的表1为一例子。

(2)定义类的属性。除了定义类外,还必须描绘概念的内在结构。例如确定哪条术语是描述哪个类的属性。这些属性会成为依附于类的属性。通常“内在的”属性,“外在的”属性都能成为本体中的属性。如果对象是结构化的,那么它的一部分可以是具体的或抽象的元素。除了最初确定的一些属性之外,还需要添加一些其他的属性。任意类的所有子类都继承了该类的属性。一个属性应该被附加在拥有该属性的最大的类上。所以以“水质记录”类定义属性为例来说明,通过相关资料分析以及参考“国家农业科学数据共享中心”[Int]中作物数据中心,对水质记录定义如表2所示:

2.2.3实例定义

一旦创建了本体的概念模型,下一步就是在实例表中定义相关的实例。定义某个类的一个实例需要确定一个类和为该实例的属性赋值。每个实例应该提供一些定义:名称,它属于的类的名称和它的属性值。在对类及类的层次关系定义好之后,需要对类的实例进行定义。本研究参考国家农业科学数据共享中心农作物的数据[12],进行了如下实例定义见表3。

2.3本体构建

采用Protégé作为本体编辑环境[13],Ontology的结构以树形的层次目录结构显示,用户可以通过点击相应项来编辑或增加类、子类、属性和实例等Ontology元素,Ontology实体的构建和对信息资源的Ontology标注较为简便;Protégé能导出多种本体格式,包括RDF模式RDFS和OWL格式,本研究采用OWL作为本体的形式化语言,OWL文件格式存贮本体数据。并且它提供插件开发环境,这就为快速原型和应用开发提供了一个比较灵活的基础。应用可以通过工具包来访问本体,这些工具包一般都提供了C++或JAVA的应用编程接口API[14]。在使用OWL表示的水产养殖本体中,通过标签<owl:Class>和<rdfs:subClassOf>来定义本体中的概念以及概念间的关系,<rdfs:equivalentClass>表示等价类,另外标签<owl:DatatypeProperty>用来定义概念的属性,<owl:ObjectProperty>表示概念与概念间的关系。另外OWL语言的另一特征就是提供了推理的能力。通过标签<owl:TransitiveProperty>来表示传递属性,标签<owl:FunctionalProperty>表示功能属性,标签<owl:inverseOf>表示逆属性。当然还有很多定义标签。通过这些标签定义概念和概念间的关系,并进行推理,从而可以获取更多的知识。图4为采用OWL语言对部分类的定义。

3结果与分析

为了更好的验证采用以上方法构建的水产养殖知识本体的有效性,将其应用于水产养殖过程质量安全管理系统的综合查询中,从检索的准确率和召回率与传统的关键词检索方法相比较,本体解析工具为Jena[15]。

功能强大,他提供的API允许处理基于RDF的本体数据,支持RDFS,OWL,DAML+OIL等本体的操作。在本系统内,实验本体数据中有60个概念,接近20个关系,包括datatypeProperty和objectProperty,基本可以反映水产养殖领域的一些应用情况。采用基于本体知识的检索,用户输入关键词,系统的查询预处理模块会对关键词进行语义分析,然后把查询条件进行服务包装,到数据源上执行检索服务,返回最终结果。如果通过关键词的结构化检索,用户可能很难表述真正的检索意图,通过语义交互后就能够对查询条件进行更加详细的扩展,以最大程度的表达用户的意图,保证查询出来的结果的完整性,并返回给最终用户。比如在关键词输入“罗非鱼”,通过语义扩展,即将等价类Tilapia、概念上位概念淡水鱼类和下位概念(尼罗罗非鱼,奥利亚罗非鱼等)以及相关的属性养殖生产阶段、养殖方式、适宜水温、pH值、放养时间、投饵量等作为相关的查询概念。表4与表5分别为采用基于本体的检索和基于关键词对五个关键词“罗非鱼”、“放养”、“水温”、“夏季”、“淡水养殖”的检索结果。

根据两个表中的数据,本研究以图形化的方式来比较基于本体的检索和基于关键词的检索两者的查准率和召回率,通过图5和图6,可以形象的看出基于本体知识的检索在准确率和召回率上都有一定的提高,因为基于本体的检索通过使用本体的水产养殖知识对关键词进行了语义扩展,使检索结果集合比单纯的关键词能够更多的挖掘用户的潜在查询需求,从而更加精确。但是召回率还不是很理想,这个和构建的本体包含的知识有很大的关系,当构建的本体比较完善的时候,召回率会提高。

4结论

根据水产领域特点和本体构建方法选择的原则,提出了一种“三阶段”本体构建方法,通过本方法试验,初步构建出了水产养殖领域本体,在较短的时间内构建出了本体。构建好的本体可以方便扩展并被别的应用使用,改进了本体构建过程。此方法将具有如下特点和意义:(1)易学、易用,减少了领域专家的参与。面向对象的思想和方法发展至今,已比较成熟,并已在多个行业和领域中广泛应用,因此这个方法对很多从事过面向对象程序设计的软件开发人员来说易学、易用;(2)减少开发系统的工作量。在开发基于本体论的语义检索系统时,前期的需求分析和数据库设计与此方法实现过程有不少交叉可以减轻不少工作量;(3)为解决本体的自动构建问题提供了一个新的思路。面向对象的很多概念和本体体系中的术语有很强的映射关系,因此利用面向对象建模工具和本体构建工具的API就有可能解决本体的半自动和自动构建问题。


转载请注明来自:http://www.zazhifabiao.com/lunwen/nykx/scyyy/35875.html