欢迎来到优发表网,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

购物车(0)

图书馆资源管理与服务分析

时间:2022-10-10 11:50:58
图书馆资源管理与服务分析

一、前言

图书馆是文献信息资源中心,随着网络化和数字化的发展,在资源建设和服务过程中累积大量高质量的数据资源,其中包含大量值得揭示和共享复用的内容实体。这些实体往往隐藏在诸如书目记录、数字资源元数据内部,没有独立标识且缺乏结构化描述。如何将这些数据资源间隐含的关联关系揭示给用户,如何让数据资源间互通互联,并在此基础上为用户提供新的服务,引起图书馆界的密切关注。

二、关联数据在图书馆应用现状

2006年Tim Berners-Lee首次提出关联数据(LinkedData)概念,随后在生命科学、地理数据、多媒体、文献出版物等主题领域得到广泛实践和应用。对于关联数据的定义,笔者认为其主要是通过制定统一标准规划,将语义网上、链接和共享的非结构化和半结构化的数据资源转化为机器可理解的富含语义的结构化数据,形成一个相关关联的数据网络,并在此基础上对数据关系进行挖掘重组和智能应用。正是基于关联数据的特性,图书馆界在其诞生之初就投入相当多的关注,并在很早展开系列应用研究和实践探索。

(一)关联数据在图书馆应用实例

2010年,W3C成立了图书馆关联数据孵化组织;瑞典国家图书馆将其联合书目开放为关联数据;美国国会图书馆将LCSH(美国国会图书馆标题表)语义化描述后以关联数据形式;德国国家图书馆采用RDF词表、SKOS(简单知识组织系统)等形式上千万条关联数据;法国国家图书馆采用SKOS将RAMEAU主题标目语义描述后为关联数据;匈牙利国家图书馆将其OPAC、数字图书馆等数据为关联数据;英国图书馆将BNB(英国国家书目)从marc21格式转换为RDF/XML格式的关联数据[1]。

(二)关联数据在图书馆应用分析

详细分析当前图书馆关联数据应用状况,发现大部分图书馆还停留在将数据资源为关联数据阶段,未能充分发挥关联数据的优势和特点。综合考量图书馆资源建设与服务开展现状,笔者认为可从以下几个方面运用关联数据。其一,资源方面。上述图书馆应用实例基本都属于该方面的应用,其主要特点就是将图书馆非结构和半结构数据采用RDF、SKOS等方式为关联数据。其二,资源发现方面。关联数据将图书馆资源与外部资源相互连接,允许通过图书馆某个点资源关联到更广泛的信息资源,不再局限于图书或其他文献本身,可横向扩展关联至作者、地点、事件等信息。目前,已有部分利用关联数据实现资源发现的搜索引擎,如Falcons、Sindice等[2]。其三,数据融合方面。随着信息化和网络化的发展,图书馆与其他机构和组织间的数据交换和共享利用越来越频繁,关联数据使得各组织、各类型的数据识别、融合、重组和再利用变得也来越容易,图书馆文献信息资源中心地位突出,承担起越来越多数据资源存储的责任,在数据融合方面作用越来越明显。其四,语义检索方面。利用关联数据可以实现语义检索突破,可将检索词匹配到人物、地点、时间、概念等,可为用户提供更为全面和更有意义的检索结果。其五,知识挖掘方面。关联数据本身具有关联特性,其与知识组织、处理和整合等方密不可分,十分契合信息检索和知识挖掘。

三、基于关联数据的图书馆资源管理与服务优势分析

大数据和网络化的时代,图书馆迫切需要引入新的技术和方法,加快提升资源发现传递的速度和质量,帮助用户更便捷发现、定位和获取资源,满足用户多元化、知识化的文献资源需求,提升图书馆资源服务水平和整体竞争力。关联数据具有统一的RDF数据模型、统一的API接口、一致的语义描述,其可关联、可复用、可扩展的特性,在图书馆资源管理和服务上具有无可比拟的优势[3]。其一,实现不同机构资源聚合和共享。通过关联数据可将馆藏资源和外部资源无缝衔接,形成相互链接的广域网络,用户通过图书馆的点资源,共享获取全域性资源和信息。其二,实现馆藏不同类型文献资源间的关联,形成多方位、多层次、立体化的组织结构,使馆藏的纸质资源、数字资源及特色原生资源等互联互通。如利用关联数据技术查询“量子计算”相关信息,检索结果会汇聚显示馆藏纸质图书、期刊、学术论文、视频、微课等各类资源的相关信息。其三,实现数据发现和知识挖掘。通过关联数据的语义描述,形成理论上无限关联的RDF关系图,计算机通过数据关联,进行数据资源的发现,并通过理解和处理数据资源间关联,挖掘出新的资源和知识。其四,实现图书馆资源统一检索能力的跃升。关联数据因具备统一的API接口,加之强大的语义检索和自然语言检索功能,能有效减少冗余检索结果,提升图书馆资源统一检索的检准率和检全率[4]。

四、基于关联数据的图书馆资源管理与服务模型构建

基于关联数据在图书馆资源管理与服务中的应用优势,笔者构建了基于关联数据的图书馆资源管理与服务模型。该模型由三层组成:资源采集层、资源关联层和资源服务层。如图1所示。

(一)资源采集层

该层主要采集馆藏资源和外部资源,并对采集的资源信息进行拆分转换,利用关联数据技术进行统一。其中,馆藏资源不仅包括传统纸质图书,还包括各类型数字资源。根据关联数据的基本要求在该层要实现馆藏资源的语义关联,其具体步骤如下:首先运用RDF模型描述各类数据资源,生成具有唯一标识度的HTTPURI,同时生成RDF格式的元数据;其次,利用RDF链接关联相关资源,揭示资源之间关联类型[5]。外部资源主要指能够被图书馆链接到的图书馆关联网络中的各种数据源。外部资源具有不同数据接口、不同数据结构和不同存储格式等特异性,通常包括数据库、电子表格、XML文档、Web网站等,需要运用不同方法将各类数据源转换为RDF格式数据。如,针对数据库中的数据集,可采用D2RServer和Triplify等工具将其转化为RDF格式数据;针对电子表格数据,可使用ConverterToRDF将其转换为RDF格式数据;针对XML文档,可直接为关联数据,也可使用诸如ASP等脚本语言编写一段脚本,将其文档转化为RDF格式;针对Web网站,可采用RDF/XML技术进行转换[6]。

(二)资源关联层

该层主要对统一的RDF格式数据进行语义关联,使得图书馆的馆藏资源和外部资源融合为统一整体,形成一个面向图书馆资源管理和服务的关联数据集。在该层实现数据资源的语义关联,首先进行数据解析,也就是对资源采集层形成的HTTP URI进行解析,获取RDF模型描述的三元组信息;其次运行本体映射,就是将不同本体描述的同一资源,通过映射规则一一对应确立关系;接着进行实体对应,将不同的数据集中表示同一实体的数据建立关联关系;最后构建具有语义的可被理解的关联数据集[7]。

(三)资源服务层

该层利用获取的关联数据集,处理数据集和用户之间的交互,为用户提供资源检索、信息咨询、资源导航、主动推送、定题服务等。在开展资源检索时,用户可使用接近自然语言的方式提出检索、咨询、导航等请求,系统将对内外部资源进行预先索引,并分析处理相关信息,然后并根据用户的不同诉求,构造特定的语义查询语句,全面检索语义数据资源,最后智能选择查询结果以RDF链接形式反馈给用户[8]。用户通过RDF链接访问各类关联数据资源,实现不同数据集间的关联和复用。此外,在满足用户主动检索诉求外,系统还可通过收集和分析用请求习惯,建立用户个性化需求档案,主动推送相关资源和服务。资源服务层既是构建该模型的最后一环,又是为用户提供资源检索和知识获取的第一步,是用户与读者间的桥梁和纽带。

五、数据实验与分析

信息工程大学图书馆在门户网站升级改版中,部分运用上述研究结果,利用关联技术对馆藏海量数字资源进行语义分析和资源聚类,并结合可视化技术自动生成检索词相关的近期热点趋势和知识图谱等。用户可通过资源间关联,清晰了解各个领域的关键技术,以及关键技术的发展趋势和他们之间的关联关系。为用户从专业解释、研究趋势、领域交叉和相关机构等方面进行知识发现的关联性推荐[9]。本次实验以信息工程大学图书馆本地镜像资源作为数据源,从2021年纸质和数字资源检索次数排名前五的关键词随意选定一个作为检索主题,与中国知网检索系统进行对比试验,验证基于关联数据的资源管理与服务模型的合理性和有效性。纸质图书排名前四关键词:Python、MATLAB、C、Java,数字资源排名前四关键词:计算机网络、毛泽东选集、人工智能、Python。我们选取“Python”作为关键词进行数据实验,利用图书馆网站基于关联数据技术构建的检索系统,得到部分检索结果。关联数据在图书馆资源管理和服务中最主要应用就是数据资源的整合、检索和浏览,从实验结果可以看出,检索得到结果对象包括电子图书、期刊论文、学位论文、会议论文、报纸文章、音视频及报告等,能够很直观实现基于关联数据资源整合的信息检索和浏览。进一步点击“Python”词条,能关联到研究趋势、关联研究、领域交叉、相关机构等信息,并以可视化和知识图谱等方式呈现给用户。在中国知网数据库中以“Python”作为检索词,进行跨库检索。查询结果只能是数据库中收录的资源数据,而无法将图书馆整体馆藏融合进来,检索不到诸如电子图书、音视频等信息。实验结果表明,关联数据应用图书馆资源管理和服务中有很大的优势,包括实现馆藏不同类型资源的深入整合,最重要的是能够实现语义检索,提高查全率和查准率,可以为用户提供更加直观、智能化的服务体验,能够大大提升图书馆资源管理和服务的效率。

六、基于关联数据的图书馆资源管理与服务的几点思考

(一)数据资源间关联关系的建立和扩展

关联数据的重要特性就是资源发现和扩展,要发挥关联数据的作用,需要持续建立新的关联关系。不仅要将图书馆内部资源建立连接,还要与来自其他机构的资源建立链接[10]。一方面,从发展的角度来看,图书馆不能局限于将自购资源为关联数据,应用利用资源聚合优势,为用户搜寻提供更多更好的资源和知识,可以考虑将一些特色数据资源为关联数据,增加图书馆数据资源的吸引力和竞争力。另一方面,发挥关联数据云图的优势,将馆外大量丰富的关联数据资源扩展关联为图书馆可资利用的资源库和数据库。例如,检索“大数据”相关资源,我们不仅为用户提供馆藏图书、期刊、学术论文、会议论文等资源,还能关联扩展到馆外某一机构、科研院所或高校相关资源;查询某篇大数据文献的作者,可扩展到作者研究领域、研究团队、研究成果等。

(二)关联数据应用服务的展示和优化图书馆应用关联数据的最终目的是为用户提供更加便捷丰富的资源服务。关联数据可以将多个异构数据资源进行整合,将多个不同格式数据集进行集成,以统一简洁查询结果将所有相关信息反馈给用户[11]。目前,关联数据的导航和检索结果呈现方面还存在较大改善空间,多数关联数据应用服务只能提供以RDF格式文件为中心的浏览方式,该模式多数用户使用不便或不习惯。笔者认为可以考虑以实体对象为中心,提供更加直观贴合用户使用习惯的关联数据分类浏览服务。此外,为提升关联数据应用服务的可用性,可以考虑充分利用关联数据资源中的关联关系,对数据资源进行深度挖掘和重组,通过对资源、人物、机构、成果、团队等多类型知识内容的集成统合,为用户提供多层次关联数据服务,感受更全面立体的服务体验。

(三)新增关联数据质量保障

随着关联数据网络不断扩大,关联数据量级成倍扩展。数量的扩充必然带来质量下降的风险,如何持续为用户提供高可靠、高质量的关联数据源成为一个必须重视的问题[12]。笔者认为可以考虑建立一系列关联数据评估标准规范,新的关联数据源接入关联云图前应严格遵循关联数据规范,准确定义词表术语。另外,关联数据开放性特征,允许任何人在Web网上关联数据,如果关联数据源的Web地址发生改变,必然导致关联链接断裂,相关关联应用无法使用。因此,笔者建议建立一套监控保障机制,对关联数据URI的准确性、可用性动态监控,提前发现并剪除无效关联,保障关联数据链接质量。

(四)关联数据查询效率的提升

关联数据数量的快速增加,给关联数据查询检索效率带来极大挑战,目前较为常用的查询检索方式有三种。第一,直接抓取模式,提前从已知数据源直接抓取数据存储于本地。该模式查询检索反馈速度快,但存在数据更新慢和占用大量存储等问题。第二,遍历链接模式,依靠关联数据源间的关联关系,当接收到用户需求遍历不同数据源的链接查找相关信息。该模式无法保证数据查询结果的深度。其三,联邦查询模式,根据用户资源需求,同时查询多个关联数据源,包括一些未知的关联数据资源。该模式无法保障查询结果的准确性,且查询效率不确定。鉴于上述情况,笔者建议依据用户的关联数据需求,灵活运用三种模式。对于响应时间要求高的需求,可以预先抓取关联数据集至本地预先进行处理;对于资源质量要求高且新的需求,可以选择同时遍历查询多个关联数据源,并选取那些服务稳定、质量可靠的数据源反馈给用户。

七、结语

图书馆是一个知识和服务的集合体,如何利用自身资源为用户提供高效、便捷、优质的服务是永恒的课题。随着社会的不断发展和进步,用户需求的不断扩展和多样,图书馆必须尝试运用新的技术和方法,提升服务质量满足用户不同需求。关联数据因其突出特性,在图书馆资源管理和服务中得到关注,但是关联数据在图书馆的广泛推广还面临诸多现实问题,需要更多同仁认知、熟悉关联数据的内涵和价值,需要领域专家开展更深入的研究和指导,需要业界更加大胆实践和探索。H

参考文献

[1]陈春燕.基于关联数据的开源情报语义聚合框架研究[J].图书情报导刊,2021,6(05):46-53.

[2]王欢.基于关联数据的高校图书馆智库服务模型研究[J].情报探索,2021(02):117-122.

[3]王伟.基于关联数据的新一代机构知识库知识发现系统研究[J].图书馆学刊,2020,42(11):72-75.

[4]李清.数据关联技术在数字图书馆知识发现服务中的应用[J].中国中医药图书情报杂志,2021,45(05):33-35+39.

[5]杨娟,张秀兰.基于关联数据的高校图书馆智库服务模型研究[J].图书情报导刊,2020,5(02):19-24.

[6]张影.基于数据关联与文本挖掘技术的图书馆文献资源开发利用研究[J].中国中医药图书情报杂志,2019,43(04):48-51.

[7]ALinkedData-basedSemanticInteroperabilityFrameworkforDigitalLibraries[J].RevistaCubanadeCienciasInformáticas,2019,13(1).

[8]阳广元.基于关联数据的图书馆服务研究现状与展望[J].图书馆理论与实践,2019(06):43-45+112.

[9]HyoungjooPark,MargaretKipp.LibraryLinkedDataModels:LibraryDataintheSemanticWeb[J].Cataloging&ClassificationQuarterly,2019,57(5).

[10]欧石燕.面向关联数据的语义数字图书馆资源描述与组织框架设计与实现[J].中国图书馆学报,2012,38(06):58-71.

[11]高劲松,李迎迎,刘龙,等.基于关联数据的知识发现模型构建研究[J].情报科学,2016,34(06):10-13+18.

[12]高劲松,李珂,梁艳琪,等.关联数据环境下图书馆知识服务模型研究[J].情报科学,2016,34(05):64-68.

作者:李晋;张立;王颖;朱旭 单位:战略支援部队信息工程大学图书馆