首页 / 新闻资讯

国家标准《期刊文章标签集》:为我国建设世界一流期刊提供标准保障


作者:林家乐  来源:中国新闻出版广电报
时间: 2022/8/8 10:54:33

  国家标准《期刊文章标签集》(GB/T 40959-2021)的宣贯工作正在进行中,该标准已于今年6月1日开始正式实施。该标准由全国新闻出版信息标准化技术委员会(SAC/TC 553)归口管理,北京玛格泰克科技发展有限公司、中宣部机关服务中心(信息中心)、北京北大方正电子有限公司等9家单位牵头起草。

  标准一小步,行业一大步。长期以来,我国一些高质量期刊因为数据标准问题和技术问题,被国际学术互联体系拦在门外。这项标准的实施,将有助于解决这个问题。

  何为期刊文章标签集

  期刊文章内容是由许多内容要素组成,例如期刊名称、年、卷、期、页码、标题、作者、作者单位、摘要、关键词、正文各级标题和段落、图表、公式、参考文献等内容。供人阅读的传统期刊及对应的PDF文件,通常是用版面语言(例如字体、字号、版面位置等)对这些内容进行描述和区分,以方便读者阅读。

  随着信息技术的发展,期刊内容生产过程自动化程度的提高,以及读者对知识传播、汇聚、获取、复用和分析的需求不断深化,必须依赖计算机程序对内容进行自动化处理,因此,这种面向人阅读的版面语言已经无法满足当前的需求,而需要用一套计算机可理解的语言来描述内容要素。经过国际期刊界数十年的探索和研究,一致认为用一套定义好的标签来描述文章内容要素,然后把这些标记好的内容组织成一个XML文件,是一个非常理想的解决方案。这套标记内容的标签就称为文章标签集(JATS)。JATS通常包括标签集合和标签属性集合两部分内容。

  目前,国外已经有多套成熟的JATS,例如NLM JATS,NISO JATS。国内的一些机构也定义了满足自己需求的JATS。

  标准不一导致重复加工等问题

  JATS的最大特点是灵活性。原则上,每个机构都可以根据自己的需求、喜好和习惯来定义标签。因此,每个机构定义的标签集就会有很大的差异性,这给期刊内容生产的各个业务环节集成,以及内容在不同平台上传播,特别是在全球的传播带来很大的障碍,导致内容无法复用,需要进行重复加工。目前,我国期刊内容重复加工所带来的损失超过1亿元。此外,因为内容需要重复加工,也导致生产效率降低、刊出周期变长、内容错误率增加、内容传播效果降低、传播成本增加等问题。

  既然国外的JATS已非常成熟,我们为什么不直接使用呢?事实上,在国家标准发布之前,很多机构就是套用国外的JATS标准,但在使用过程中发现了很多国外标准无法解决的问题。比如,国内期刊管理要求期刊的CN号、主管、主办单位等内容,就无法用NISO JATS来描述;国外期刊没有双语问题,所以它们的标准也不支持内容的双语描述,这导致国内机构在使用国外标准时面临很大困难;国内期刊有很多特殊需求,例如汉字拼音、特殊字符,以及文章认证和评奖内容、二维码等,都无法用现成的国外JATS来描述。

  基于以上原因,我国迫切需要制定能满足和适应我国期刊发展需要,又能与国际接轨的期刊文章标签集国家标准。在期刊界有识之士的不断呼吁下,科技部2018年启动的“国家质量基础的共性技术研究与应用”重点专项“数字出版技术标准研究”中,把《期刊文章标签集》国家标准进行立项和研制,并于2021年11月29日正式发布。

  国家标准充分考虑我国期刊生产特色

  GB/T 40959-2021内容包括标准使用范围、规范性引用文件、术语定义、期刊以篇为单位的XML文件结构、元素标签集和元素属性集,并提供了XML文件的示例,及元素标签和属性的索引。元素标签集规定了期刊文章中可能用到的元素标签259个,元素属性集规定了标签集所支持的124个属性。

  GB/T 40959-2021填补了我国在期刊全文内容结构化描述方面的空白,是我国期刊内容生产、传播、存储、交换和复用,以及内容增强服务方面最重要和最基础的数据标准。其创新性包括:实现国内外数据标准的兼容,极大地促进我国期刊的国际化合作进程,提高我国期刊的国际影响力和我国的文化软实力;首次把文章的出版阶段(创作阶段、评审阶段、录用阶段、预出版阶段、正式出版阶段等)纳入数据标准中,不仅能体现传统的出版流程,也有利于对文章首发权的保护;充分考虑我国期刊出版特色,例如双语内容展示,主管机构对期刊管理的需要等;融合和体现中文特色,特别是汉字生僻词的编码及描述方面,将是对内容结构化描述的一个巨大进步;覆盖各种新型出版形态,如数据出版、增强出版等。

  为期刊生产和发布提供技术优化提升方案

  GB/T 40959-2021标准的发布与实施,将为我国期刊的生产、发布和数据交换提供技术优化提升方案,达到以下效果。

  优化业务流程,提高出版效率。内容描述标准化可以使计算机在内容生产的全流程中提供更加智能化的技术支持,期刊出版可以不断优化业务流程,降低劳动强度,同时提高出版效率和期刊质量。

  实现快速发表服务,缩短出版周期,提升学术内容传播的时效性。内容标准化描述使期刊文章在不同平台之间的数据交换和重组变得简单,可以快速把被录用的文章以标准的格式发布到各个数字出版平台,实现即用即发,大幅度降低出版周期,提高学术内容传播的时效性。

  实现内容复用、自动提取和动态重组,为读者提供差异化内容服务,提高内容的传播效率。基于标准化的内容描述,使计算机能根据用户的差异化需求,自动对内容进行分割、重组和呈现。

  提供内容增强服务,提升期刊知识服务能力。借助于大数据的支持,可以在原有的内容中插入、链接、展示文章以外有价值的内容,实现文章与整个学科和产业融合,提高期刊的知识服务能力和品牌形象。

  实现与产业链上下游之间和国际间的数据交换,提升期刊的国际影响力。国际学术出版和传播体系中的各个主体都采用标准的数据格式进行采集、集成和提供服务,我国期刊的内容描述只有遵循这些相同的标准,才能被这些平台收录和集成,进而提高我国期刊的国际影响力。

(作者单位:北京玛格泰克科技发展有限公司)

发布日期: 2022-08-17  浏览: 2894

北京玛格泰克科技发展有限公司

Beijing Magtech S&T Co., Ltd

法律声明

在您开始访问、浏览及使用本网站前,敬请仔细阅读此声明的所有条款。您一旦浏览、使用本网站,即表明您已经同意接受本声明条款的约束。

联系信息

+86-10-62662699/98/97/96 
support@magtech.com.cn
北京市海淀区西小口路66号中关村东升科技园B2楼B301 (100080)

微信公众号

版权所有 © 北京玛格泰克科技发展有限公司 1999-2019 京ICP备05021913号 建议使用IE 8.0以上浏览器