分类筛选
分类筛选:

关于科技文献论文范文资料 与面向外文科技文献信息的知识组织体系建设思路有关论文参考文献

版权:原创标记原创 主题:科技文献范文 科目:职称论文 2024-03-09

《面向外文科技文献信息的知识组织体系建设思路》:关于免费科技文献论文范文在这里免费下载与阅读,为您的科技文献相关论文写作提供资料。

摘 要:为了实现海量外文科技文献信息的知识组织,促进文献信息内容的知识关联和知识发现,国家科技文献信息中心组织实施了“面向外文科技文献信息的知识组织体系建设和示范应用”国家科技支撑计划项目,提出构建以内容建设为核心,加工协作和开放服务平台为依托,以自动处理智能检索和知识服务应用为基础的知识组织体系建设和示范应用.论文在系统分析现行知识组织建设的4种模式可供借鉴特点,说明了该项目的目标、主要建设内容,最后总结信息组织基础设施建设中的难点.

关键词:知识组织体系 叙词表 本体

中图分类号: G254.0 文献标识码: A 文章编号: 1003-6938(2013)01-0002-06

1 导论

信息过载是网络时代面临的一个重要问题.近些年来西方发达国家、组织、企业(如欧盟、美国医学图书馆、联合国粮农组织等)纷纷开展信息组织开放应用的研发项目,来推动信息建设基础平台的创新性实践和技术改善,如美国医学图书馆建设的统一医学语言系统(Unified Medical Language System,UMLS),谷歌收购了语义搜索公司Metaweb,采用其主打产品Freebase——大规模的开放结构化信息数据库,来推出知识地图服务.我国在“十一五”期间,在国家层面推进了1.7万台大型科学仪器设备(单台套原值50万元以上)、105个野外科学观测研究台站,135万份自然资源实物、970万号标本、4000余种标准物质,22万种科技图书、6万种科技期刊、138万余条标准和技术法规、41万项科技成果信息,以及160TB的科学数据等大量科技资源的整合、开放与共享[1].

面对海量的信息,如何从传统图书馆基于文献知识组织方法,向适应计算机海量信息处理基于概念单元或知识单元方向发展,如何从资源链接的整合,向提供深入知识内容的整合,成为了我国在“十二五”期间信息资源建设的一项重要任务.因此由国家科技文献信息中心牵头,组织实施了国家科技支撑计划“面向外文科技文献信息的知识组织体系建设和示范应用”项目,来构建我国面向外文科技文献的知识组织体系,以支持信息揭示、组织和发现.本文通过知识组织建设模式的现状分析,论述面向外文科技文献信息的知识组织体系建设的目标和主要内容,并对信息组织基础设施建设中存在的难点进行探讨.

2 知识组织建设模式分析

通过大量的跟踪调研和凝练,可以把西方发达国家或组织推进知识组织实践应用归纳为四种模式:基于传统知识组织体系关联的语义网络模式、基于传统知识组织体系整合抽取的本体仓库模式、基于语义网的参考网络模式和本体网络模式.

2.1 基于传统知识组织体系关联扩展的语义网络模式

UMLS (Unified Medical Language System)是美国国家医学图书馆建立的关于生物医学和健康的知识组织体系,是基于传统知识组织体系关联扩展建设语义网络模式的典型代表.UMLS共有三个知识源数据库,它们是Metathesaurus、语义网络(Semantic Network)和专家词典(SPECIALIST lexicon).Metathesaurus是集成了各种叙词表、分类表、编码集、用于病人护理的可控词汇表、健康服务表、公共健康统计、生物医学文献目录和索引等基础医学、临床医学和健康服务的知识组织体系.Metathesaurus通过概念来组织,其目的是将同一概念的不同名称和形式连接在一起,标识不同概念之间的关系.每个概念都分配了至少一个语义网络的语义类型,这样保证了Metathesaurus中的所有概念在语义网络中相对一致的分类.语义网络的目的是提供Metathesaurus中所有概念的统一分类和一系列概念之间的关系.语义网络由两部分组成:①一组较为宽泛的主题类目,也称语义类型;②一组语义类型之间的关系,或称语义关系.专家词典是NLM建立的三个知识源数据库之一,是UMLS项目的组成部分.专家词典的作用是为自然语言处理系统提供词汇信息.专家词典的词汇包括通用英语词汇和生物医学专业词汇.UMLS试图强大多语言词汇库,用于多种类型的信息系统,如病例、科学文献、指引和公共健康数据,从而在读者查询请求和资源之间建立概念上的关联,在具有相同知识内容的资源之间建立关联.

2.2 基于传统知识组织体系整合抽取的本体仓库模式

该模式的典型代表是联合国联农组织发起的FOS项目,旨在通过创建、整合和利用本体,来加强渔业信息系统的信息整合和语义互操作能力.FOS项目整合的资源包括:①OneFish:一个渔业项目的门户,采用等级主题树方式对信息进行组织,大约有超过1800个主题,主题含有简短的摘 要、标识符、相关联的材料,如文件、网站、元数据.②AGROVOC叙词表:包含大约2000个渔业的叙词和16000相关的扩展词.③AA叙词表:超过6000个叙词.④FIGIS:一个整合渔业信息的全球化网络,其采用参考表来组织资源,主要包括水生物种、地理对象、水生资源、海洋渔业、渔业技术,大约有300个顶级概念,向下分成4级,共含有30000个资源对象,并能支持多语种互操作.FOS希望设计出一个全面的本体参考模型,以满足:是(部分是)以领域为基础本体,能分享规范的KOS;足够的灵活性,能在同一背景下包括不同的观点或者视角;聚焦在渔业领域的核心推理框架[2].FOS建立一个多层级的本体仓库来整合资源,主要包括三层内容:

顶层本体或称为基础本体,用来表示通用一般性的概念.FOS采用了WonderWeb European项目建立DOCLCE本体模型作为基础,DOCLCE分为三个基本的大类,即:持久性和临时性;品质和品质属性及抽象概念.并采用了乘法的方式来扩展下位类.

核心本体是在顶层本体的基础上,结合本体描述与情景的原理(根据情景的作用、任务、参数、状态来具体化说明)来构建了核心本体.将FOS需要整合的资源按照ODP的本体描述模型转化成术语数据库,提取术语数据库顶层概念,保留TDB框架,专家精简以及采用其他本体设计模型[3].最终,在AA的1600个顶级类、AGROVOC的83个顶级类和FIGIS的约400个顶级类中选取了10%作为核心本体.

科技文献论文参考资料:

国家科技图书文献中心

外文文献网站

书籍参考文献

科技小论文500字

英文参考文献格式举例

关于科技的论文

结论:面向外文科技文献信息的知识组织体系建设思路为关于本文可作为科技文献方面的大学硕士与本科毕业论文科技文献论文开题报告范文和职称论文论文写作参考文献下载。

和你相关的