XML/RichHTML加工服务
期刊全文结构化和富媒体呈现是期刊数字出版从根本上区别于传统出版的基础,只有实现了全文内容结构化,才能谈到内容增强、移动出版、知识服务,及媒体融合。否则,所谓的数字出版就只是简单的内容电子化。
Magtech得益于长期对国际相关标准的研究,以及在国内大力推进行业相关标准的制定,利用智能算法技术,实现了全文内容生成标准的XML文件。在大数据的支持下,可以实现对XML文件进行内容增强,然后由网刊3系统,直接发布为RichHTML文件。
Magtech制作的XML文件具有以下特色:
(1)支持常见的原文件:包括方正书版文件fbd、Word、Indesign、方正飞翔ffx、Latex等。
(2)生成的XML文件支持多种标准:包括NLM DTD 3.0,NISO JATS 1.1,CAS JATS1.0及国内行业标准 CJATS 1.0。生成的XML文件,可以直接提交PMC使用。
(3)标引颗粒度高:实现语义层面的不可划分的颗粒标记。
(4)文本化:对数学公式、表格等均进行了文本化处理,以保证内容的可复用。
(5)内容重组:实现图、表的位置调整,实现图随文、表随文。
Magtech的RichHTML具有以下特色:
(1)页面简洁美观,极大提高了阅读体验。
(2)采用RWD布局,实现屏幕自适应,不均适合PC端阅读,也在移动端能得到完美的呈现和阅读体验。
(3)内容可复用:对图、表、数学公式、参考文献列表,均实现可复用。
(4)支持对象的doi解析,可以对图、表进行单独的doi注册与解析。
(5)动态重组:RichHTML的呈现方式与风格,可以随着网站风格变化而动态重组。另外,全球首创实现了参考文献列表的动态重组。
(6)知识标引:利用文本识别技术,实现知识实体的自动抽取与识别,并与事实型科学数据库连接。
(7)实现内容增强服务,提供增强内容的“现场阅读”功能,避免阅读中断。
目前,有大约400多种期刊(包括5本美国期刊)在使用该服务,基本上他们的数字出版水平,代表了国内前沿水平。
发布日期: 2019-09-21 浏览:
9075