分类筛选
分类筛选:

关于语义论文范文资料 与数据密集、语义、可视化和互动出版全球科技出版趋势有关论文参考文献

版权:原创标记原创 主题:语义范文 科目:发表论文 2024-01-28

《数据密集、语义、可视化和互动出版全球科技出版趋势》:本论文为您写语义毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

[编者按]“交流是科学的本质”,而以学术期刊和学术专著为代表的科技出版是300多年来全球科学交流活动的根基.从20世纪下半叶开始,以计算机和网络为核心的数字技术持续改变着科技出版的文献型态、业务模式、资源获取方式乃至出版者、图书情报机构和同时作为作者和用户的研究人员之间的关系.本刊约请“武汉大学‘70后’学者学术发展计划”数字科学交流团队成员撰写了一组有关科技出版最新发展趋势的文章.其中《数据密集、语义、可视化和互动出版:全球科技出版发展趋势研究》广泛探讨了全球科技出版领域的几个显著发展趋势;《语义出版:数字时代科学交流系统新模型》集中论述语义出版这种科技出版的新形态;《不同载体环境下学术期刊文献被引规律实证研究》分析了在纸质载体和纸质—数字混合载体等不同载体条件下,学术期刊论文被引情况的变化;《科学交流中的著作权责任分析:基于P 共享环境的分析》讨论新型技术条件下科学交流和科学出版中的著作权责任问题.

[摘 要]探讨全球科技出版领域呈现的数据密集型出版、语义出版、可视化出版和互动出版等趋势.指出数据密集型出版从宏观层面构建海量数据的框架蓝图,为科学范式的转变提供基础环境;语义出版通过对各种文献进行标引关联,从微观层面铺设结构化数据的基础设施,解决数据和信息的机器理解问题;可视化出版作为重要的直观表达工具,从文献组成部分、文献架构、文献网络三个层面最大限度地提升科研人员获取信息的效率和效果;互动出版目前以学术维基出版物和全新的同行评议为主要特色,既是“无形学院”在网络环境下的延伸,也渗透于正式科学交流中,从读者和用户层面打破科学信息开放、共享、交流的主要障碍.

[关键词]数据密集语义出版可视化互动

[中图分类号]G237[文献标识码]A[文章编号]1009-5853(2012) 04-0073-08

1990年代末以来,数字化技术潮流急剧地影响并改变着全球科技出版的整体面貌.跨国科技出版集团纷纷完成了纸质期刊和图书的数字化,并实现了较好的营收.其中斯普林格出版集团1996年启动旗下期刊的数字化转档工作,2004年完成包括过刊在内所有纸质期刊的数字化工作.2011年,约翰·威利出版公司数字化的学术类产品和服务收入达9.99亿美元,占学术类出版总收入的59%[1].然而,这一波科技出版和科学交流的发展植根于科学研究本身的范式转换[2],因此其表现不限于数字技术推动的载体迁移和升级,而是朝着增强型科学出版和交流的方向发展,并集中体现在数据密集型出版、语义出版、可视化出版和互动出版等方面.从科学出版和交流的内容来看,新增海量数据将转化为有效的结构型数据,并向着语义和智能出版方向发展;从科学出版和交流的工具来看,科技文献将普遍采用3D图像、视频、动画、虚拟现实等多种媒介呈现方式和技术;从科研成果的组织方式来看,科学信息和内容将根据用户需求从线性向非线性组织方式发展,并表现出更强的交互性特征.

1数据密集型出版

历史上每一次重大变革都源于需求和现实的可能性,数据密集型科学的诞生也是历史发展的必然.一方面,科学领域的数据量呈爆炸性增长态势.到2020年,全球以数字形态存在的数据总量将是2009年时的44倍,达到35泽字节(zettabytes)[3].以生物医学文献为例,其增长率每20年翻一番,截至2008年该领域编目在册的文献已达1800万篇,其中当年新产生的文献80多万篇.研究显示,在目前的知识接收方式和状况下,若想在流行病学领域保持领先地位,研究者平均每天大约要花21小时进行阅读.正如东尼·海(Tony Hey)在《第四范式:下一次科技革命》中所言:专家们正在被大量数据淹没.另一方面,借助性能更加强大的计算机,对海量数据进行计算和挖掘已成为可能.因此,如何帮助科研人员突破纷繁数据的遮蔽,发现隐藏在海量数据之中的重要规律,成为数据密集型科学所要解决的核心问题.而数据的出版、存储、解析、交换和再利用成为解决科学问题的关键.

其实早在上世纪70年代,世界科学技术情报系统(UNISIST)提出的UNISIST科学交流模型就将表单渠道作为交换科学信息和研究成果的渠道之一.该渠道包含的主要内容便是科技数据[4].该模型的提出在当时极富预见性.它指出未来科学数据必将以一种独立信息源的方式存在并被加以处理.而当科学项目产生的数据量步入千万亿字节的时候[5],围绕科研成果所展开的数据加工、组织、发布等一系列出版活动也将发生根本变化.今后科研成果的出版将实现数据和文献的充分融合.正如吉姆·格雷(Jim Gray)所说:“所有科学文献都上网,所有科学数据都上网,而且它们之间具备可互操作性.”(见图1)这也使得基于数据重用的荟萃分析(Meta-analysis)等研究方法得以施展:研究者可以从互联网上调用前人存储的数据直接纳入自己的数据集中,用以分析或检验自己的研究.由欧盟资助的“促进科学记录永久存取项目”(PARSE Insight)发布报告,针对数据和文献相互整合的需求提出7大标准,分别是可获取性、可发现性、可解析性、可重用性、可引用性、可管理性和长期保存性[6].

要实现上述科技出版和科学交流的发展目标,必须有开放标准、互操作协议和相应的制度规范予以保障.技术标准和协议涉及数字对象标识(DOI)、开放资源定位协议(OpenURL)、资源描述框架(RDF)、元数据获取协议(OAI-PMH)等,主要用以实现信息对象的标识、定位及交互使用;目标是将全球的数据集合起来,形成庞大的动态数据集供科研人员使用.2011年,美国科学基金会(National Science Foundation,N*)开始要求所有基金项目申请者提交相应的数据管理和共享计划[8],以便对研究过程中产生的数据进行有效管理.从2012年4月开始,自然出版集团为旗下《自然神经科学》(Nature Neuroscience)开设补充信息提交系统,并对相关数据信息进行严格的同行评议.另外,由多家期刊联合发起的国际数据仓储项目Dryad也为科学期刊文章中出现的科学数据集提供登记、描述、保存和公共获取服务[9].但从PARSE Insight调查结果来看,科研人员对科学数据出版的认知状况不甚理想,67%的科研人员对DC、OAI-ORE、OAI-PMH等数据交换标准一无所知[10].此外,科研人员、出版商、图书馆及数据中心等利益相关者的诉求也存在差异.其中,科研人员和图书情报机构比较关注数据存放的安全性和数据的版权归属.前述调查显示41%的被调查者认为版权问题是阻碍数据分享的主要问题[11].出版商则比较关注如何建立跨组织的数据获取和检索规范等问题.

语义论文参考资料:

结论:数据密集、语义、可视化和互动出版全球科技出版趋势为关于语义方面的论文题目、论文提纲、语义特征是什么论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

和你相关的