欢迎来到优发表网,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

购物车(0)

期刊大全 杂志订阅 SCI期刊 期刊投稿 出版社 公文范文 精品范文

科学计数法的学情分析(合集7篇)

时间:2023-08-12 09:05:44
科学计数法的学情分析

科学计数法的学情分析第1篇

关键词: 图书馆学研究方法方法论调查分析

中图分类号: G250文献标识码: A 文章编号: 1003-6938(2010)01-0111-04

A Statistical Analysis of the Library Science Papers Research Methods

Jia ErpengYi Jinghan(Department of Information Management, Zhengzhou University, Zhengzhou,Henan, 450001)

Si Miaomiao(Library, Hubei Vocational College of Bio-Technology, Wuhan, Hubei, 430070)

Abstract: Relevant scientific research methods support the completion of the science research. So library science research methods are an important component of the library science system. Through a statistical analysis to the research methods of the academic articles published in 11 library journals, this article sums up the current condition of method application in library science in our country, and prospects for the future of library science research methods in our country.

Key words: library science; research methods; methodology; survey analysis

CLC number: G250Document code: AArticle ID: 1003-6938(2010)01-0111-04

工欲善其事,必先利其器。科学研究是富有创造性和艺术性的活动,方法是科学研究的工具和途径,图书馆学研究过程也与科学的研究方法不可分离。图书馆学研究方法是在继承一般科学研究方法的基础上,根据自身的研究对象、学科性质而进行融合与发展,形成自己学科的研究方法体系。随着图书馆学情报学研究范围的扩大、研究对象的复杂,其研究方法呈现出多样性特点。从多个角度对其进行研究,既促进了我国图书情报事业的发展,反过来又进一步刺激了研究方法的多样化。本文以11种图书馆学专业期刊2006~2008年所刊载论文为数据源,分析论文的研究方法,试图总结出图书馆学研究方法的规律及其发展趋势。

1我国图书馆学方法论的研究

图书馆学研究方法,是图书馆学学科体系的重要组成部分,一方面,它使得图书馆学研究能够准确、充分地揭示研究对象的本质与规律,是图书馆学研究的保障;另一方面,整个图书馆学的研究中对方法的研究不能偏废,方法研究是学科研究内容的一部分。[1 ]我国图书馆学方法论研究开始于20世纪80年代。1981年刘迅先生在《图书馆学通讯》上发表了《要重视图书馆学方法论的研究》一文。紧接着乔好勤先生在该刊1983年第一期上刊登了《试论图书馆学研究中的方法论问题》,[2 ]运用统计方法对《图书馆学通讯》等三种专业刊物1980~1981年发表的学术论文研究方法进行分析。并提出了图书馆学方法论的三层次说法,即图书馆学的研究方法可以分为哲学方法、一般科学方法和专门科学方法。随后出现了有关图书馆学方法的大量学术论文,还有一些著作,如王崇德的《图书情报方法论》。[3 ]

从宏观上看,图书馆学方法论的三个层次基本得到认同。对一般科学技术研究方法的探讨,也分为三个层次,最底层是具体的技术层次,中间层是一般的研究方法层次,最高层则是哲学层次。[4 ]图书馆学的一般科学方法,主要是指引进和移植相关科学的研究方法和研究成果运用于图书馆研究,可分为:信息获取方法(主要指调查法、统计法、试验法和历史法等),信息加工方法(主要指老三论、新三论等)。[5 ]对图书馆学专门方法探讨的文章很多,虽然还没有统一的认识,但是普遍认为文献计量学方法和引文分析法是典型的图书馆学专门方法。另外从研究的性质来分,图书馆学的研究方法也可以分为定性和定量方法。随着对此研究的深入,图书馆学方法论体系会不断地得到完善。

3数据来源

在数据收集中,笔者选取了11种图书馆学专业期刊:《中国图书馆学报》、《大学图书馆学报》、《图书情报工作》、《图书馆杂志》、《图书情报知识》、《图书馆》、《图书馆论坛》、《图书与情报》、《图书馆理论与实践》、《图书馆建设》、《图书馆工作与研究》作为调查对象,具体统计了2006年~2008年间各期刊学术论文使用研究方法的情况。数据主要来源于中国知网,小部分数据来源于各期刊主页。在数据统计中,去除了一些信息资料类文章,如征文通知、会议通知等(见表1)。

4数据统计分析

本文总共统计了8159篇学术论文,通过对所选的各篇学术论文,逐篇分析其篇名,个别文章查阅了摘要、正文等详细信息,根据各科学研究方法的含义,归纳每篇论文采用的科学研究方法,并将其研究方法归纳为15小类(见表2)。由于每篇文章采用方法很难准确判断,有的文章采用了多种研究方法,所以从表2中可以看出,最后的论文合计总数(8273篇)大于调查的论文总数(8159篇)。在计算各类研究方法的论文占调查总数的百分数时,是除以调查总数(8159篇),所以百分数之和是(101.3997%)而不是100%。

(1)理论分析法

运用理论分析法的主要是一些分析归纳与概念推理类研究,以及思辨类的学术论文。从表2中可以看出,采用理论分析法的学术论文共2904篇,占调查论文总数的35.593%,理论分析法是我国图书馆学研究中最常用的方法。研究方法的运用主要受到学科性质和研究任务影响,图书馆学从目前来看应该属于社会科学,而且人文色彩比较浓厚;我国图书馆界也有重理论的现象,这与国外主要以定量方法为主、重应用有很大不同。随着其它学科背景研究者的加入,看问题的视角会有所变化,相应的研究方法也会多样化。社会科学的发展是由定性方法向定量研究过渡的过程,图书馆学科也要注重定量分析方法的应用。

(2)操作实验法、调查研究法

在调查的学术论文中,运用操作实验法的共有830篇,占到总数的10.173%。这类论文主要研究技术性的问题,比如系统开发设计、数字图书馆建设、网络信息资源开发组织等。随着图书情报工作环境、研究对象的变化,图书馆学研究关于技术的内容会越来越多。

调查研究法是社会科学常用的一种研究方法。图书馆学是一门实践性很强的学科,调查是获取原始数据的一个重要的方法。图书馆学研究中主要进行抽样调查,通过问卷、网络来收集数据资料。采用调查研究方法的学术论文一共745篇,占总数的9.131%,调查方法的运用在调查数据中占有很大一部分,说明研究更贴近实际问题。

(3)实例分析法、历史方法

实例分析法通常是以具体的实例来介绍经验或说明问题,论文中主要是以国内比较著名的大学或科研院所图书馆、国外有名的图书馆等为例子进行分析,对于其它图书馆的建设、信息资源开发服务起到了借鉴作用。

历史方法主要用于论述关于图书馆事业史、人物评价、文献学、目录学等内容的论文,是一种传统的研究方法。有的期刊专门开辟了关于图书馆事业史、文献学的专栏,历史方法的论文在调查论文中占到了7.501%。

(4)系统方法、管理学方法

系统方法主要是用系统的思想,从整体的角度来观察问题,这种方法对我们认识研究起到很大作用。虽然有的文章不能明显地看出是运用了系统方法,但是系统方法贯穿于观察问题的整个过程。管理学方法是将管理学的方法移植在图书情报学的研究中,图书馆在机构建设、运营方面都要运用到管理学的知识方法。

(5)数理方法、文献计量学方法、比较法、经济分析法

数理方法主要是数学方法在图书情报学研究中的应用,是一种定量的研究方法。采用数理方法的学术论文有304篇,占调查论文总数的3.726%。数学方法的运用,也说明图书馆学研究者正在试图定量地揭示研究对象,随着本学科逐渐走向成熟,这一方法将继续普遍化。

文献计量学方法是用数学和统计学方法,对文献量、作者数、词汇数等的定量化研究。调查的论文中运用此方法的占到3.199%,在调查论文中占到的比例比较低。文献计量学方法也应用于其它学科研究,从CNKI数据库中我们以“文献计量”为题名,可以粗略地检索到600多篇论文,内容涉及很多其它学科研究。

比较方法也是比较常用的一种研究方法,通过对多个相关事物或事物的各部分之间进行比较,揭示其共同点和差异点。

经济分析法是将经济学的方法运用到图书馆学的研究当中,研究内容包括图书馆营销、资源共享效率评价、纸质资源与电子资源的经费问题、资源服务的经营模式等等。

(6)控制论方法、引文分析法、内容分析法

明显运用控制论方法的论文很少,调查中只有79篇。占到总数的0.968%。但是控制论的思想在很多论文中都有所体现。

引文分析法是利用各种数学及统计学的方法对科学期刊、论文、著者等的引用和被引用现象进行分析,以揭示其数量特征和内在规律的方法。在所调查的论文中,明确使用引文分析法的有23篇,占总数的0.282%。引文分析法作为图书情报学科的一种专门方法,运用也很广泛。在CNKI中用“引文分析”作为题名可以检索到1200多篇论文。

内容分析法产生于传播学领域,是一种客观的量化方法,是从大量样本进行特征识别的系统方法,具有统计性,是一种从公开资料中萃取情报的重要方法。因为它是新方法,统计中只有6篇。

(7)其它

其它中包括有专利分析方法、社会网络方法、SWOT分析法、法律分析方法、心理学方法、美学方法、传播学方法、医学理论方法等等。

5我国图书馆学研究方法的发展趋势

5.1定量分析与定性分析相结合

根据表2数据,我们可将研究方法大致分为两类:第一类是定性方法,包括理论分析法、实例析法、历史方法、系统方法、管理学方法、比较法、经济分析法、控制论方法,百分比总共占到61.62%;第二类是定量方法,包括操作实验法、调查研究法、数理方法、文献计量学方法、引文分析法、内容分析法,百分比总共占到26.584%。从数量来看,定量研究方法所占比例比起定性方法还很小,这是由于理论分析法的比例太大。对于图书馆学的科学研究,目前来看定性方法用的多一些。但对于具体问题,定性方法和定量方法各有特点,用哪种方法要根据具体情况而定。

理论分析法是一种定性研究方法,在学科研究中发挥了重要的作用。由于定性方法缺乏科学的数据支撑,其理论分析就显得没有深度和广度。随着学科的发展,定性与定量研究方法相结合是发展的趋势。图书馆学情报学领域已经大量采用定量的研究方法,如调查研究法、数理方法、文献计量学方法等。定量方法的运用使研究更精细、更科学,站在定量的角度解释图书馆学情报学的内在规律,从而在广度和深度上推动学科的发展。[6 ]

5.2现代信息技术的影响越来越大

随着信息技术、网络技术的发展,图书馆学的研究内容产生了巨大变化,与网络信息、信息系统等有关的技术性研究论文数量会不断增多。在表2中,操作实验法所占比例为10.173%,我们可以清楚地看到这一点。

新技术的发展还为经典的研究方法提供了新的实现工具。[7 ]研究这可以通过互联网进行数据采集,以网页形式的网络调查、用即时通信(instant messaging)软件(如QQ)的调查、[8 ]电子邮件调查等,这些都为更好地完成调查提供了多种途径。随着搜索引擎的运用普及,搜索引擎的服务器记录和保存了用户与搜索引擎的交互过程,这种数据称为使用记录(transaction log),使用记录分析(transaction log analysis)成为一个研究热点。另外,计算机还可以辅助研究者进行定性数据分析等。在文献计量学的基础上产生了网络信息计量学方法,在引文分析方法的基础上出现了链接分析方法,这都是现代信息技术对研究方法的影响。

5.3吸收其他学科的研究方法

表2中的管理学方法、数理方法、经济学方法、内容分析法等都属于移植其它学科的方法,占10.85%。“其它”占7.185%。这些都说明了图书馆学研究中移植了许多其它学科的理论或方法。

在学科的发展中,一方面要具有从其它学科吸收养分的能力;另一方面要能为其它学科提供养分。随着图书馆学科研究队伍的壮大,研究者会大量借鉴其它学科的研究方法,会产生新的研究方法,如内容分析法、情景分析法等。当然我们不能盲目地去移植新的研究方法,而要与图书馆学情报学本学科的实际情况相结合,将其融入本学科研究之中,通过适当的研究方法来为研究服务。

5.4实证方法的应用

调查研究法、实例分析法就属于实证性研究方法,从表2中的数据中就可以看出,共占到17.061%。近些年来研究者也开始注重实证研究(evident-based studies)方法,[9]它是在获取研究对象客观数据材料的基础上,通过数据分析,考察研究对象各有关因素的相互影响及其影响方式,从个别到一般,归纳出事物的本质属性和发展规律,它是观察法、实验法、统计法等的综合运用。实证研究通过实际数据分析,连接了理论与实践,一定程度上有利于图书馆学研究水平、学术地位的提升。

总之,方法都不是万能的,各种研究方法都有自己的优点和缺点,或者是有适用的条件。定性与定量研究方法的结合将成为图书馆学方法的主流,新的方法与新的技术将得到更多的应用。利用多种先进技术手段来收集数据、分析数据,综合多种研究方法来探讨复杂的研究问题将会越来越多。所以研究方法的运用将是多元化发展,合理的研究方法体系应该是多种研究方法的有机结合与互补,从各个不同的角度对研究对象进行分析。

参考文献:

[1]邓小昭.信息管理研究方法[M].北京:科学出版社,2007:1-33.

[2]乔好勤.试论图书馆学研究中的方法论问题[J].图书馆学通讯,1983,(1):54-62.

[3]王崇德.图书情报方法论[J].北京:科学技术出版社,1988.

[4]杨建军.科学研究方法概论[M].北京:国防工业出版社,2006:1-24,395-409.

[5]罗方等.我国图书馆学方法论研究的现状及趋势[J].图书馆建设,2006,(2):19-20.

[6]邱均平.文献计量学[M].北京:中国人民大学出版社,2007:260-283.

[7]华薇娜.我国80年代图书馆学情报学研究状况的定量分析[J].情报学报,1995,14(3):218-225.

[8]金武刚等.图书馆员网络社区信息交流行为实证研究――“大旗底下”QQ群个案分析[J].大学图书馆学报,2008,(5).

科学计数法的学情分析第2篇

关键词 图书馆学 情报学 研究热点 信息可视化

1引言

被Web of Science(下文简称“WoS”)中的SSCI数据库收录的图书馆学情报学即INFORMATIONSCIENCE&LIBRARY SCIENCE(下文简称“LIS”)类期刊共计85种(截止2016年4月7日)。刊载在这些期刊上的研究成果,一方面反映了世界主要国家或地区LIS领域研究的热点和前沿,另一方面,也反映了际上高水平研究者的其他科研信息。以往由于载文量巨大,加之受分析技术工具的限制,研究者多是运用人工逐篇抽样阅读的方法,对国际顶级期刊的部分文献进行研究,带有较强的主观性,无法完整、客观地对某个时间段内的全部文章进行分析。专家的主观分析虽然具有一定的指导意义,但往往缺乏公允性、完整性和客观性。笔者将WoS中的与北京大学图书馆编辑的《国外人文社会科学核心期刊总览》(下文简称《总览》)中重合的27种图书馆学情报学类期刊作为研究对象,并根据2014年影响因子的高低作适当增减,运用Citespace可视化软件,对WoS中2014-2015年刊载的3287篇文献进行科学计量分析。本文要探讨的问题是:近2年国际高水平的LIS期刊的研究热点及其覆盖的科学领域、科研机构,论文的国家或地区合作情况、核心作者与核心被引作者群、核心被引期刊概况。希望本文具有如下特点:全样本数据的完整性、研究对象的时效性、分析工具的客观性以及知识图谱的直观性等,为我国研究者了解和掌握国际LIS领域的研究热点、前沿、对象、方法、研究者、研究机构、核心期刊等情况提供完整、及时、客观、直观的数据分析,减少研究者获取本领域科研情报的盲目性,提高研究效率。

2研究方法

2.1引文分析法

1955年,加菲尔德(E.Garfield)在《科学》上发文提出了一种科学文献书目系统,可剔除对虚假、过时或完整性较差的数据的任意引用,使学者们可了解到对早期论文存在的批评。引文分析法至此正式产生。引文分析就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用现象进行分析,以便揭示其数据特征和内在规律的一种文献计量的分析方法。本文使用引文分析法,主要原因是该方法能回答以下三个问题:第一,某些文献为什么能持续成为研究者关注的核心?第二,这些核心文献中已经出现或即将出现哪些趋势?第三,某领域或学科的文献与其他学科的交叉呈现出何种关系或态势?引文分析有三种基本类型:①对引文数量进行研究,主要用于评价期刊和论文等。②对引文间的网状关系或链状关系进行研究。科学论文间存在着一种引用关系网,如A被B引,B被C引,C又被A引等,研究这种关系主要用于揭示学科的发展与联系,并展望未来前景等。③对引文反映出的主题相关性进行研究,主要用于揭示科学的结构和进行文献检索等。引文分析法的上述三种类型,分别回答和解释了上述三个问题。

2.2词频分析法与共现分析法

本文所指的“词”,即Citespace软件中的“Term”。美国著名情报学专家萨隆(G・Salon)认为,Term表示主题词、名词、标引词、情报项、文献著录项、标引与检索的信息单元等。词频分析是将文献中的多个因子联系起来的引证分析方法,它能科学地评价文献、文献作者的学术水平,揭示学科的热点、前沿以及发展趋势。共现分析法则是将文献中的各种共现信息定量化的分析方法,通过共现分析,可以发现研究对象之间的亲疏关系,挖掘隐含的或潜在的有用知识,并揭示研究对象所代表的学科或主题的结构与变化。在计算机技术的辅助下,共现分析在构建概念空间和实现语义检索、改进知识组织中文本的分类效果、分析文献中的知识内容关联、挖掘知识价值等方面彰显出独特的提炼和概括功能。通过软件进行词频分析与共现分析,能较好地抽取出所分析文献样本的热点、前沿趋势以及科学结构等关键情报。

2.3科学知识图谱与信息可视化方法

科学知识图谱(Mapping Knowledge Domains)是显示科学知识的发展进程与结构关系的一种图形,用可视化技术描述人类随时间拥有的知识及其载体,绘制、挖掘、分析和显示科学技术知识以及它们之间的相互联系。在组织内创造知识共享的环境以促进科学技术研究的合作和深入。

信息可视化涉及计算机生成交互式信息图示的设计、开发和应用。首先要处理抽象的、非空间的数据。把非空间的数据转换成直观的、有意义的图像对该领域极其重要,这个转换的过程是一个创造性的过程,设计者可以赋予图像新的意义。本文运用科学图谱与信息可视化的理论,通过Citespace软件,将需分析的文献进行图像转化和处理,赋予客观、科学的意义。

2.4 LLR算法与PageRank算法

本研究采用LLR算法对聚类进行命名。LLR即对数似然比算法,全称Log-Likelihood Ratio。其基本原理是:假设对于类别Ci,词Wi的频度(oc),集中度(β)和分散度(丫)等指标组成向量Vji,选取聚类命名就是根据Vij来判断Wi是否可以作为类别Ci的特征词。LLR算法如下:

式中,LLR为词Wi对于类别Ci的对数似然比,p(Ci\Vij)和p(Cj\Vij)分别为在类别Cj和Cj中的密度函数。

PageRank网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种根据网页之间相互的超链接计算的技术,作为网页排名的要素之一,以Google公司创办人拉里・佩奇(Larry Page)之姓来命名的。该算法的发明者对网络超链接结构和文献引文机制的相似性进行了研究,把引文分析思想借鉴到网络文档重要性的计算中来,利用网络自身的超链接结构给所有的网页确定一个重要性的等级数,当从网页A链接到网页B时,就认为“网页A投了网页B一票”,增加了网页B的重要性。最后根据网页的得票数评定其重要性,以此来帮助实现排序算法的优化,而这个重要性的量化指标就是PageRank值。文章运用Citespace中的Page-Rank算法,对相关数据结果进行PageRank排名,为数据分析提供另一个维度的视角。

3数据来源及分析工具

3.1数据来源

笔者通过WoS中的期刊引文分析报告(JCR:Journal Citation Reports社会科学版)查询2014年(2015年尚未公布)的"INFORMATION SCIENCE&LIBRARY SCIENCE”类别中被收录的所有期刊,共计85种(详见表1,以影响因子的值作降序排列)。由于这85种期刊并未完全聚焦在图书馆学情报学领域,因此,本研究结合北京大学的《总览》进行聚焦。《总览》的编撰历时2年多,由北京高校图书馆期刊工作研究会成员馆、国家图书馆等相关单位的33位图书馆专业人员参加研究,163位学科专家参加了核心期刊的定性评审,具有较高的指导意义。图书馆学情报学档案学期刊共计61种。经对比,WoS与《总览》重合的图书馆学情报学期刊共计29种,并根据检索结果以及影响因子适当增减。随之,以Web of Science核心数据库为检索库,以“出版物来源一下表27种期刊名称”和“时间跨度一2014年-2015年”,文献类型选择“Article”,语言类型选择“English”,共命中3287条文献记录,通过数据导出和处理,将文献记录以Citespace能识别的WoS输出格式导入Citespace软件中。

3.2分析工具

CiteSpace是一款着眼于分析科学文献中蕴含的潜在知识,并在科学计量学(Scientometric)、数据和信息可视化(Data and Information Visualization)背景下逐渐发展起来的一款引文可视化分析软件。本文使用Citespace 4.0.R4版本,对数据进行处理、分析、制图。此外,使用WoS自带的统计分析功能,结合Citespace的可视化分析功能,交叉配合使用。Citespace软件有多个不同版本,开发者截至笔者投稿之日,仍然在优化该软件,故该软件对某些项目的统计结果可能出现与WoS的统计有微小差异,可视为科学研究中的误差,但不影响主要数据分析。该工具已经不仅仅提供引文空间的挖掘,而且还提供知识单元之间的共现分析功能,如作者、机构、国家/地区的合作等。

4结果分析

4.1研究热点分析

研究热点可看作某研究领域中,研究者共同关注的一个或多个研究主题,笔者认为共词分析可反映目标领域的热点概况。通过Citespace对Term与Node的提取,可对3287篇文献的关键词进行共词(Co-words)聚类挖掘分析,运行结果如图1所示。该图反映了国际LIS领域近两年的热点问题,聚类号表示某词经LLR算法聚类后所在的主题。Mo-durility(M)即网络模块化评价指标,值越大,表示网络得到聚类越好,Q的取值区间为[0,1],当Q>0.3时得到的网络社团结构是显著的。Silhouette(S)是用来衡量网络同质性的指标,当其值>0.5时表示聚类结果是合理的,越接近1,同质性越高。通过LLR算法,M=0.8835,S=0.5014,得出的图谱合理、客观,研究热点聚类名称如图1、表2所示。

图1中黑色字体表示不同文献共同的关键词,“#数字”表示运用LLR算法对共同关键词提取后命名的聚类词,每个色块表示由各类不同的文献组成的具有相近研究主题的聚类。通过对关键词的聚类,得到15个研究主题,聚类间有交叉覆盖的现象,表示这些聚类之间存在研究主题上的交叉,其关系较为紧密,与其他聚类不交叉的色块表示该类主题具备较为独立的研究性质。以“#0,#1……”等形式对聚类进行编号(Cluster ID),聚类号越小,表示该聚类的经典文献数量(Size)越多,Silhouette值表示经典文献之间的紧密程度,Mean(Year)项表示平均年份,可反映聚类中文献的时效性,Top Terms即以LLR算法命名的聚类名称。经过自动聚类并结合图书馆学情报学专业知识,相关度较高的关键词聚类情况见表2。

基于LLR算法的聚类名称,可客观反映2014-2015年国际图书馆学情报学研究领域的热点问题,可将上述聚类归纳为四个方面。

(1)传统LIS领域。

布莱达(Mas-Bleda)等基于欧洲的在线出版物,使用爬虫技术对1525名高被引科学家进行研究,这是第一个对链模式高被引研究者机构网站的研究,用以确定哪些网络资源被科学家们。斯图德(Sotudeh)等使用科学计量方法与比较的方法,就女性科学家在科学生产力、影响等方面与男性科学家进行对比研究,发现虽然女性科学家人数较少,但同样有较好的科研成果和影响。拉弗蒂(Raf-ferty)等通过对八位用户的调查访谈,对基于故事图像的索引输入法进行了探讨。戈卢布(Gol-ub)等对将杜威十进制分类法(DDC)作为建立知识组织系统(KOS)增强社会标签,提高主题索引和检索信息效率进行了研究,结果表明受控词汇表索引和检索的重要性是@而易见的。苛勒(Koler)等以发表在2007年的14个国际期刊中的文献为研究对象,对土木工程领域开放获取文献的被引次数进行研究,结果表明开放不是引用的充分条件,但增加了期刊上发表文章的引用次数。阿尔瓦雷斯(A1-varez)等使用文献计量方法对虹膜识别研究领域进行了全面概述。郭(Kuo)等使用共被引方法模型对核心文献之间的关系进行了研究,实现了运用多元统计技术来构建知识结构的表征。吴(Wu)等通过对台湾大学32名被试者进行调研,研究了研究生如何看待和使用谷歌学术搜索。索步尔(A1-Shboul)等运用角色法、系统设计法等,以约旦王国的一个先进的信息通讯技术环境抽样为例,研究了集成现有的信息需求行为的模型。布龙斯坦(Bronstein)等运用分布式的信息检索自我认知量表(IRSPS)对205名学生进行匿名问卷调查,发现参与者报告了高水平的自我效能感。

(2)医学信息领域。

戈尔泰普(Gultepe)等开发了一个决策支持系统,用于患高乳酸盐血症的高危病人的生命体征的常规测量,支持实验室研究。斯塔尔茨(Stultz)等对剂量警报是否合适进行了评价,将警报与订单分类,比较了儿科医院内定制的和非客户化的恰当的剂量警告范围。贝格海莱(Baghele)等运用文献计量方法对Pubmed数据库中印度牙医的文献的趋势进行了评估,发现从1960年到2012年,每位印度牙医平均贡献了0.53篇文献。

(3)心理学与计算机科学领域。

加维兰(Gavilan)等探讨了移动广告引发的心理意象的作用及其对信任和购买意愿的中介效应。特拉(Tatry)对国与国之间的合作网络映射到可视化的强度关系进行了研究。谢(Xie)探讨了社会媒体在数字图书馆中的应用和识别等相关问题。

(4)管理科学领域。

齐(Chi)等研究了非源代码项目的特点,并在社会科学文献评价中对德国对政治科学出版物进行了研究,结果表明,非源代码项目显著提高了出版物的数量。萧(Hsiao)等运用基于意图的五个理论模型对大学生的行为意图进行调查。克拉托赫维尔(Kratochvil)等对使用在线学习进行信息素养教学进行了研究。雷德斯多夫(Leydesdorff)等测量了三螺旋协同在俄罗斯部级、省级区域创新系统中的水平。斯瓦尔(Swar)应用社会网络分析技术的混合方法和三重螺旋指标,以网络知识的视角对南亚的信息通信技术基础设施的重要性进行了研究。

从上述领域的研究主题来看,研究热点呈现的特点是集中在传统的LIS领域,研究主题不断深化、扩展,使用的研究方法规范、科学。近2年的国际LIS研究主题中,网络计量、索引、文献计量、信息需求、信息检索是持续的研究热点。

4.2研究前沿分析

笔者认为研究前沿分析主要以共被引(CitedReference)的文献网络关系加以体现。科学计量学的奠基人普赖斯(Price)提出“研究前沿”的概念,即科学引文网络中高被引且时效性强的文献集合。他认为研究前沿能动态地反应某研究领域的本质。加尔菲尔德(Garfield)将研究的前沿定义为一组核心的高被引论文和引用论文,认为研究前沿的名称可以从论文标题中出现频率最高的词或短语中提取。陈超美认为研究前沿是一组及时、动态且有潜在研究价值的问题,研究前沿的知识基础是引证和共引痕迹。本文中,Citespace的具体操作设置是:“Term Source”部分同上文,“Node Type”部分选取“Cited Reference”选项。运行数据后,得到研究前沿聚类图,见图2。

从图2可见,将共被引文献聚类后得到16个研究主题。结合图书馆学情报学专业知识,排除相关度较小的聚类后,以“#0,#1……”等形式对聚类进行编号,聚类号越小,其聚类的文献数量越多。共被引文献的聚类情况如表4所示。

基于LLR算法的聚类名称可客观反映2014-2015年国际图书馆情报学研究领域的前沿问题,将上述聚类归纳为三个方面。

(1)传统LIS领域。

米克斯(Meeks)等对交集电子健康记录(EHR)进行研究,检查以往开发的概念模型的适用性,以实现全面了解其对英国国民健康服务(NHS)的影响。安珂尔(Ancker)等对电子健康记录的影响(EHRs)结果的个体差异性进行了研究。洛伦岑(Lorentzen)等运用网络计量学的方法,探讨了计量学和网络挖掘两个领域潜在的更紧密的联系和合作。韦加(Veiga)等通过对金融分析系统的实证研究,探讨了企业系统(ES)的成功因素。萨沃莱宁(Savolainen)等基于激励因素评价理论,研究了情绪和情感激励在信息检索过程中的五方面的影响。牛(Niu)等基于有效的科学引文角度,用文献计量法分析了科学引文索引扩展数据库中1992―2011年地球科学的相关科研情报。谭(Tan)等对1995年到2010年的科学引文索引扩展中的蛋白质学文献进行了计量分析,评估全球相关科学成果产出,发现研究人员集中在生化研究方法、生物化学和分子生物学。

(2)管理科W领域。

韦加(Veiga)等通过对金融分析系统的实证研究,探讨了企业系统(ES)的成功因素。常(Chang)等使用社会网络分析来确认天文研究机构具有强有力的国际合作关系,研究发现最强的关系体现在相关机构的跨洲科研合作。萧(Hsiao)等运用基于意图的五个理论模型对大学生的行为意图进行调查。

(3)计算机科学领域。

提图埃尔(Turel)等对管理团队提供的集中在信息技术资源的战略管理进行了研究,综合了资源和应急管理信息系统的观点与公司治理理论,检查董事会层面的IT治理的关键前因和后果(ITG)。庞(Pang)等基于资源观,尝试建立一种有效的测量技术,提出一种评估这些资源的协同效应对公司的能力影响的方法,并使用组织理论发现IT驱动的公司的战略角色资源。陈(Chen)等研究了信息技术(IT)的业务价值,该研究通过调查填补了IT的业务价值的中介作用这一空白,研究了该业务流程的灵活性和环境因素的调节作用。该研究的对象属于计算机科学领域,其研究方法则属于管理科学领域。

从上述领域的研究主题来看,研究的前沿呈现的特点是运用传统LIS方法研究跨学科领域的对象(如有机发光二极管、交集电子健康记录、金融等)。LIS在计算机科学、管理科学、医学、生物学实践领域的应用将成为今后LIS领域的研究重点。

4.3科学领域结构

科学领域结构可反应LIS领域所涉及的各个学科之间的合作、交叉关系。可从合作者的聚类、文献的聚类等方面进行探索,但最直观的方式,是直接分析由WoS导出的数据中的分类号(Category),运行结果如图3所示。

由图3和表6可知,从发文量来看(图中年轮的大小表示发文量的多少),LIS领域近两年覆盖的主要科学领域依次为:图书馆学情报学、计算机科学、健康护理科学与服务、医学信息、政府与法律、法律、商业与经济、管理领域。从PageRank维度来看,政府与法律的中性度最高,健康护理科学与服务、商业与经济次之,图书馆学情报学、计算机科学、法律、管理紧随其后。这表明,在图书情报领域的高水平成果中,受网络关注最高的是政府与法律领域。本研究样本文献构成的研究分布网络显示,上述研究领域互相交叉,这表明当前的学科研究趋势正朝着以图书馆学情报学为主,以其他相关领域为辅的多学科交叉研究的方向演化。

5结论

本文依据Citespace的引文分析及可视化功能,在识别和探讨LIS领域的研究热点与前沿动态问题过程中,得出以下结论:

首先,通过对2014-2015年SSCI数据库中27种核心图书馆学情报学期刊刊载的3287篇文献进行研究,通过关键词与主题的LLR聚类分析,发现传统图书馆学情报学、管理科学、计算机科学以及医疗信息等领域的图书馆传统服务和计量、信息需求与检索、索引、信息检索、组织工程、名称匹配算法、网络2.0、非源项、技术接受模型、三螺旋理论等主题是近两年国际LIS领域的持续研究热点。

科学计数法的学情分析第3篇

【摘  要  题】理论纵横

【关  键  词】链接分析法/网络信息计量学/情报学/方法论……

【  正  文】

20世纪90年代以后,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络信息计量学(Webmetrics  or  Cybermetrics)就应运而生,用新的研究方法如链接分析法来描述和组织网络信息世界。

1 网络信息计量学

网络信息计量学是在网络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:网络计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。网络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。

2 链接分析法研究现状

2.1 链接分析法的内容

链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法——索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。

2.1.1 链接分析法在网络信息组织方面的作用

网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页。一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链接到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点;如果许多重要的网页都指向Yahoo,则其重要程度会更高。这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好——当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。

2.1.2 链接分析法在网络信息检索方面的作用

链接分析主要应用于网络信息检索方面,如搜索引擎收集信息、检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots直接访问Web提取出权威页(Authority  Page)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始网页,Robot从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(Neighbor  Graph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google等搜索引擎就采用了超链接分析技术来对检索结果排序。

2.1.3 链接分析法在网络信息资源评价方面的作用

传统的引文分析法在学术方面衡量学术期刊重要性的指标之一是“影响因子”(IF),哪家期刊和论文被引用次数多,影响因子就高,谁就被认为是权威,论文也就是优秀论文。在互联网上IF对应于统计指向某一网页的链接数目后对该网页作出的排序,网站引用分析对应的是某个站点网页被其它站点引用的情况的统计分析,也就是网页可能被其它网站搜索提问命中的结果数的多少,采用计分法和线性代数方法对中心网页和权威网页分数进行迭代求和,以确定权威网页和中心网页。这与百度搜索引擎的创始人李彦宏1996年提出的搜索引擎的第二定律:“人气质量定律”相一致。根据这一定律,用链接分析法进行统计网站被链接和访问次数,可以作为评价网站和网络信息资源质量的一个指标。再加上相应的链接文字分析,就可以用在搜索结果的排序上了,对搜索结果进行的按相关性排序,不完全依赖于词频统计,而是更多地依赖于超链分析。在Internet上链接关系反映的是网页在全世界范围内、同一学科类属的影响力,评价范围是很广的、甚至全球性的。目前主要利用搜索引擎工具在网络上检索网站和网页的链接情况,并按相关性对检索结果进行排序,大大方便了用户在浩翰的信息海洋中迅速准确地获得有用的信息,易于操作、实用且可以节省用户的时间,在一定程度上可以弥补同行评议等定性方法的缺陷。

2.2 链接分析法对情报学研究方法的意义

苏联科学家巴甫洛夫说过:“科学是随着研究方法所取得的成就向前的。研究方法每前进一步,随之我们面前也就开拓了一个充满种种新鲜事物的更辽阔的远景。”情报学是一门新兴的综合性边缘学科,是一个开放的综合性知识体系,它善于吸收其它相关学科的知识和研究方法。上世纪60年代后,随着科学的日益发展,科学研究中应用研究、实用研究和开发研究比重逐渐增大,情报学研究方法体系取得了长足进步,表现在:一是情报研究的领域、对象、内容等的扩大和深化;二是现代科学学科与方法的创立和发展。情报学研究方法体系是动态的、发展的。情报学科要想在原有的基础上实现学科研究模式的更新、学科结构的变革和学科体系的拓展,就必须研究和采用新的思维方式和新的研究方法,及时反映最新的学科学术动态和最新的理论学说,移植、借鉴其它学科的研究方法,如哲学方法、数学方法、社会学方法、经济学方法、信息技术方法等来丰富自己的研究方法,并加以创造和大胆创新,不仅引起自身学科结构的变革和深化学科前沿的研究,而且不断发展新的分支学科,促使学科研究充满时代气息。

链接分析法大大拓展了信息计量学在网络环境下的应用,充实了网络信息计量学的内容,是情报学研究的新领域,完善了情报学方法论体系。它是情报学逐渐成熟的一个重要历程碑,标志着情报学理论方法的一个新的飞跃。

2.3 链接分析法目前存在的问题

在文献计量学中,传统的引文分析法只要统计参考文献数据就可完成引文分析的任务,但是在互联网上,链接分析法的研究对象是网络信息资源,网络信息资源覆盖范围广、动态性强,具的信息量巨大、不确定性、缺乏合理组织、难以预测等特点,且信息过载(Information  Overload)和信息污染(Information  Pollution)现象严重;引用与被引用关系也变得十分复杂;链接分析法的适用范围也是有限的;Internet是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。因此,在使用链接分析法时要充分考虑以上问题,尽大可能保证其结果的可靠性。

3 结束语

由于链接分析法借鉴了引文分析法的方法和思路,是情报学研究方法在网络环境下新应用,目前链接分析法主要实验工具是搜索引擎,但随着网络信息技术如人工智能、网络信息检索、计算机网络、知识挖掘、自然语言处理等的发展,必将为链接分析法的研究和开发应用提供更为有力的支持。情报学也必将充分利用网络信息技术,吸收其它学科的先进方法来深化、完善自己的方法论体系,建立起更为完善的体系结构,从而改变情报学学科的面貌。

【参考文献】

1 徐久龄等.网络计量学的研究.情报学进展1998-1999年度评论,第三卷.北京:航空工业出版社,1999:78-105

2 夏旭等.网络计量学研究:现状、问题与发展.图书馆论坛,2001,(12):44-47

3 邹志仁.论情报研究方法体系.江苏图书馆学报,1990,(2):18-23

4 杨涛.链接分析法存在的问题及改进方法.图书情报知识,2002,(3):62-63

5 刘雁书,方平.Web网站站外链接类型与特征调查-链接分析法可行性研究.大学图书馆学报,2001,(5):65-68

6 邹菲.试论网络信息计量学在数字图书馆中的应用.图书情报知识,2001,(1):16-17,20

7 邱均平.信息计量学(一).情报理论与实践,2000,(1)

科学计数法的学情分析第4篇

【摘 要 题】理论纵横

【关 键 词】链接分析法/网络信息计量学/情报学/方法论……

【 正 文】

20世纪90年代以后,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络信息计量学(Webmetrics or Cybermetrics)就应运而生,用新的研究方法如链接分析法来描述和组织网络信息世界。

1 网络信息计量学

网络信息计量学是在网络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:网络计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。网络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。

2 链接分析法研究现状

2.1 链接分析法的内容

链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法——索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。

2.1.1 链接分析法在网络信息组织方面的作用

网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页。一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链接到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点;如果许多重要的网页都指向Yahoo,则其重要程度会更高。这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好——当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。

2.1.2 链接分析法在网络信息检索方面的作用

链接分析主要应用于网络信息检索方面,如搜索引擎收集信息、检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots直接访问Web提取出权威页(Authority Page)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始网页,Robot从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(Neighbor Graph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google等搜索引擎就采用了超链接分析技术来对检索结果排序。

2.1.3 链接分析法在网络信息资源评价方面的作用

传统的引文分析法在学术方面衡量学术期刊重要性的指标之一是“影响因子”(IF),哪家期刊和论文被引用次数多,影响因子就高,谁就被认为是权威,论文也就是优秀论文。在互联网上IF对应于统计指向某一网页的链接数目后对该网页作出的排序,网站引用分析对应的是某个站点网页被其它站点引用的情况的统计分析,也就是网页可能被其它网站搜索提问命中的结果数的多少,采用计分法和线性代数方法对中心网页和权威网页分数进行迭代求和,以确定权威网页和中心网页。这与百度搜索引擎的创始人李彦宏1996年提出的搜索引擎的第二定律:“人气质量定律”相一致。根据这一定律,用链接分析法进行统计网站被链接和访问次数,可以作为评价网站和网络信息资源质量的一个指标。再加上相应的链接文字分析,就可以用在搜索结果的排序上了,对搜索结果进行的按相关性排序,不完全依赖于词频统计,而是更多地依赖于超链分析。在Internet上链接关系反映的是网页在全世界范围内、同一学科类属的影响力,评价范围是很广的、甚至全球性的。目前主要利用搜索引擎工具在网络上检索网站和网页的链接情况,并按相关性对检索结果进行排序,大大方便了用户在浩翰的信息海洋中迅速准确地获得有用的信息,易于操作、实用且可以节省用户的时间,在一定程度上可以弥补同行评 议等定性方法的缺陷。

2.2 链接分析法对情报学研究方法的意义

苏联科学家巴甫洛夫说过:“科学是随着研究方法所取得的成就向前的。研究方法每前进一步,随之我们面前也就开拓了一个充满种种新鲜事物的更辽阔的远景。”情报学是一门新兴的综合性边缘学科,是一个开放的综合性知识体系,它善于吸收其它相关学科的知识和研究方法。上世纪60年代后,随着科学的日益发展,科学研究中应用研究、实用研究和开发研究比重逐渐增大,情报学研究方法体系取得了长足进步,表现在:一是情报研究的领域、对象、内容等的扩大和深化;二是现代科学学科与方法的创立和发展。情报学研究方法体系是动态的、发展的。情报学科要想在原有的基础上实现学科研究模式的更新、学科结构的变革和学科体系的拓展,就必须研究和采用新的思维方式和新的研究方法,及时反映最新的学科学术动态和最新的理论学说,移植、借鉴其它学科的研究方法,如哲学方法、数学方法、社会学方法、经济学方法、信息技术方法等来丰富自己的研究方法,并加以创造和大胆创新,不仅引起自身学科结构的变革和深化学科前沿的研究,而且不断发展新的分支学科,促使学科研究充满时代气息。

链接分析法大大拓展了信息计量学在网络环境下的应用,充实了网络信息计量学的内容,是情报学研究的新领域,完善了情报学方法论体系。它是情报学逐渐成熟的一个重要历程碑,标志着情报学理论方法的一个新的飞跃。

2.3 链接分析法目前存在的问题

在文献计量学中,传统的引文分析法只要统计参考文献数据就可完成引文分析的任务,但是在互联网上,链接分析法的研究对象是网络信息资源,网络信息资源覆盖范围广、动态性强,具的信息量巨大、不确定性、缺乏合理组织、难以预测等特点,且信息过载(Information Overload)和信息污染(Information Pollution)现象严重;引用与被引用关系也变得十分复杂;链接分析法的适用范围也是有限的;Internet是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。因此,在使用链接分析法时要充分考虑以上问题,尽大可能保证其结果的可靠性。

3 结束语

由于链接分析法借鉴了引文分析法的方法和思路,是情报学研究方法在网络环境下新应用,目前链接分析法主要实验工具是搜索引擎,但随着网络信息技术如人工智能、网络信息检索、计算机网络、知识挖掘、自然语言处理等的发展,必将为链接分析法的研究和开发应用提供更为有力的支持。情报学也必将充分利用网络信息技术,吸收其它学科的先进方法来深化、完善自己的方法论体系,建立起更为完善的体系结构,从而改变情报学学科的面貌。

【参考文献】

1 徐久龄等.网络计量学的研究.情报学进展1998-1999年度评论,第三卷.北京:航空工业出版社,1999:78-105

2 夏旭等.网络计量学研究:现状、问题与发展.图书馆论坛,2001,(12):44-47

3 邹志仁.论情报研究方法体系.江苏图书馆学报,1990,(2):18-23

4 杨涛.链接分析法存在的问题及改进方法.图书情报知识,2002,(3):62-63

5 刘雁书,方平.Web网站站外链接类型与特征调查-链接分析法可行性研究.大学图书馆学报,2001,(5):65-68

6 邹菲.试论网络信息计量学在数字图书馆中的应用.图书情报知识,2001,(1):16-17,20

7 邱均平.信息计量学(一).情报理论与实践,2000,(1)

科学计数法的学情分析第5篇

【摘要题】理论纵横

【正文】

20世纪90年代以后,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络信息计量学(WebmetricsorCybermetrics)就应运而生,用新的研究方法如链接分析法来描述和组织网络信息世界。

1网络信息计量学

网络信息计量学是在网络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:网络计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。网络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。

2链接分析法研究现状

2.1链接分析法的内容

链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法——索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。

2.1.1链接分析法在网络信息组织方面的作用

网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页。一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链接到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点;如果许多重要的网页都指向Yahoo,则其重要程度会更高。这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好——当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。

2.1.2链接分析法在网络信息检索方面的作用

链接分析主要应用于网络信息检索方面,如搜索引擎收集信息、检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots直接访问Web提取出权威页(AuthorityPage)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始网页,Robot从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(NeighborGraph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google等搜索引擎就采用了超链接分析技术来对检索结果排序。2.1.3链接分析法在网络信息资源评价方面的作用

传统的引文分析法在学术方面衡量学术期刊重要性的指标之一是“影响因子”(IF),哪家期刊和论文被引用次数多,影响因子就高,谁就被认为是权威,论文也就是优秀论文。在互联网上IF对应于统计指向某一网页的链接数目后对该网页作出的排序,网站引用分析对应的是某个站点网页被其它站点引用的情况的统计分析,也就是网页可能被其它网站搜索提问命中的结果数的多少,采用计分法和线性代数方法对中心网页和权威网页分数进行迭代求和,以确定权威网页和中心网页。这与百度搜索引擎的创始人李彦宏1996年提出的搜索引擎的第二定律:“人气质量定律”相一致。根据这一定律,用链接分析法进行统计网站被链接和访问次数,可以作为评价网站和网络信息资源质量的一个指标。再加上相应的链接文字分析,就可以用在搜索结果的排序上了,对搜索结果进行的按相关性排序,不完全依赖于词频统计,而是更多地依赖于超链分析。在Internet上链接关系反映的是网页在全世界范围内、同一学科类属的影响力,评价范围是很广的、甚至全球性的。目前主要利用搜索引擎工具在网络上检索网站和网页的链接情况,并按相关性对检索结果进行排序,大大方便了用户在浩

翰的信息海洋中迅速准确地获得有用的信息,易于操作、实用且可以节省用户的时间,在一定程度上可以弥补同行评议等定性方法的缺陷。

2.2链接分析法对情报学研究方法的意义

苏联科学家巴甫洛夫说过:“科学是随着研究方法所取得的成就向前的。研究方法每前进一步,随之我们面前也就开拓了一个充满种种新鲜事物的更辽阔的远景。”情报学是一门新兴的综合性边缘学科,是一个开放的综合性知识体系,它善于吸收其它相关学科的知识和研究方法。上世纪60年代后,随着科学的日益发展,科学研究中应用研究、实用研究和开发研究比重逐渐增大,情报学研究方法体系取得了长足进步,表现在:一是情报研究的领域、对象、内容等的扩大和深化;二是现代科学学科与方法的创立和发展。情报学研究方法体系是动态的、发展的。情报学科要想在原有的基础上实现学科研究模式的更新

、学科结构的变革和学科体系的拓展,就必须研究和采用新的思维方式和新的研究方法,及时反映最新的学科学术动态和最新的理论学说,移植、借鉴其它学科的研究方法,如哲学方法、数学方法、社会学方法、经济学方法、信息技术方法等来丰富自己的研究方法,并加以创造和大胆创新,不仅引起自身学科结构的变革和深化学科前沿的研究,而且不断发展新的分支学科,促使学科研究充满时代气息。

链接分析法大大拓展了信息计量学在网络环境下的应用,充实了网络信息计量学的内容,是情报学研究的新领域,完善了情报学方法论体系。它是情报学逐渐成熟的一个重要历程碑,标志着情报学理论方法的一个新的飞跃。

2.3链接分析法目前存在的问题

在文献计量学中,传统的引文分析法只要统计参考文献数据就可完成引文分析的任务,但是在互联网上,链接分析法的研究对象是网络信息资源,网络信息资源覆盖范围广、动态性强,具的信息量巨大、不确定性、缺乏合理组织、难以预测等特点,且信息过载(InformationOverload)和信息污染(InformationPollution)现象严重;引用与被引用关系也变得十分复杂;链接分析法的适用范围也是有限的;Internet是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。因此,在使用链接分析法时要充分考虑以上问题,尽大可能保证其结果的可靠性。

3结束语

由于链接分析法借鉴了引文分析法的方法和思路,是情报学研究方法在网络环境下新应用,目前链接分析法主要实验工具是搜索引擎,但随着网络信息技术如人工智能、网络信息检索、计算机网络、知识挖掘、自然语言处理等的发展,必将为链接分析法的研究和开发应用提供更为有力的支持。情报学也必将充分利用网络信息技术,吸收其它学科的先进方法来深化、完善自己的方法论体系,建立起更为完善的体系结构,从而改变情报学学科的面貌。

【参考文献】

1徐久龄等.网络计量学的研究.情报学进展1998-1999年度评论,第三卷.北京:航空工业出版社,1999:78-105

2夏旭等.网络计量学研究:现状、问题与发展.图书馆论坛,2001,(12):44-47

3邹志仁.论情报研究方法体系.江苏图书馆学报,1990,(2):18-23

4杨涛.链接分析法存在的问题及改进方法.图书情报知识,2002,(3):62-63

5刘雁书,方平.Web网站站外链接类型与特征调查-链接分析法可行性研究.大学图书馆学报,2001,(5):65-68

6邹菲.试论网络信息计量学在数字图书馆中的应用.图书情报知识,2001,(1):16-17,20

7邱均平.信息计量学(一).情报理论与实践,2000,(1)

科学计数法的学情分析第6篇

[关键词]文献计量学;科学计量学;信息计量学;网络计量学;知识计量学;发展演进;共被引分析;共词分析;情报学

D0l:10.369/j.issn.1008―0821.2017.06.025

[中图分类号]G250.252 [文献标识码]A [文章编号]1008―0821(2017)06―0155―05

随着科学技术的发展,计量学领域相继出现了文献计量学、科学计量学、信息计量学、网络计量学、知识计量学,简称为“五计学”。文献计量学的发展最早可追溯到20世纪初,以科尔和伊尔斯为研究创始人。文献计量学主要是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的结构、特征和规律的学科。科学计量学是继文献计量学的发展之际,由前苏联学者纳利莫夫和穆利钦科提出了“研究分析作为信息过程的科学的定量方法”的科学计量学。1961年,普赖斯发表的《巴比伦以来的科学》为科学计量学的发展奠定了理论基础。在1978年,蒂博尔・布老温创办了《科学计量学》杂志,为科学计量学的研究提供了学术交流平台,推动了科学计量学的发展。科学计量学是以社会环境为背景,运用数学方法计量科学研究的成果,描述科学的体系结构,分析科学体系的内在运行机制,揭示科学发展的时空特征,探索整个科学活动的定量规律的学科。

信息计量学最早被称为“情报计量学”由德国学者奥托・纳克教授提出,而在1984年,布鲁克斯发表了关于信息计量的论文,并分析了信息计量学的一些基本理论问题,对信息计量W的发展做出了重要贡献。网络计量学的相关研究可追溯到20世纪90年代后期,T.C.Amind和Peter Ingwersen于1977年,提出网络计量学的概念,作为网络计量学发展的标志。随着网络信息技术的不断发展,文献计量学在网络中的应用逐渐增多,网络计量的学的发展逐渐受到研究者的重视。尤其是Ingwersen在1988年,提出网页的影响因子用来对一定时期内相关网页关注情况的分析,对网络计量学的发展起到十分重要的作用。国内学者邱均平从研究对象、方法、内容和目标等方面对网络计量学进行定义,提出网络计量学是采用数学、统计学等各种定量方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以便揭示其数量特征和内在规律的分析学科。在信息技术快速发展下,计量学的发展也在不断拓展,从农业经济发展到工业经济时代,计量学从文献计量学发展到信息计量学,而目前已经进入知识经济时代,人们逐渐意识到知识战略地位的重要性,知识经济和知识管理在全球的普遍兴起,以知识单元为计量对象的知识计量学从此诞生。知识计量学是以整个人类知识体系和知识活动作为研究对象,采用计量学方法对知识载体、知识内容、知识活动及其影响等进行定量研究的交叉性学科。

1数据来源与研究方法

1.1数据来源及清洗

本文数据来源于中国知网CNKI和中国引文索引CSSCI数据库,检索时间为2016年12月1日,在CNKI中以检索主题:“文献计量学”and“信息计量学”and“科学计量学”and“网络计量学”and“知识计量学”,筛选重复记录,最终得到7 614条记录,在CSSCI数据库中以关键词=“计量学”or篇名=“计量学”为检索条件,最终获取1418条记录,通过将记录的重复处理后,最终得到有效数据条数为8 020条有效记录。借助CiteSpace软件,将最终获得的有效数据导入可视化软件进行时区分割和阈值选择。研究对象时间设定为1998-2016年,单个时间分区为2年,即9个时间分区。

1.2研究方法

可视化图谱是计量学发展进程与结构关系的一种新兴的研究方法,对数据进行深度分析,并将数据分析结果可视化,通过可视化图谱探明研究领域的总体全景、研究热点、知识基础,分析并推测研究领域之间的交叉、渗透和衍生趋势。Eppler与Burkard提出知识可视化,通过在科学计算可视化、数据可视化和信息可视化的基础上发展而来,促进知识的传播与创新。可视化图谱以直观、清晰的方式,对科技前沿、科研方向以及研究热点提供了独特的视角。本文通过文献共被引分析、作者共被引分析以及关键词共现分析对我国“五计学”的发展进行跟踪,帮助研究者厘清“五计学”的发展趋势和研究动态。借助陈超美博士研发的可视化软件CiteSpace,对我国“五计学”发展以可视化方式呈现文献共被引分析、作者共被引分析和关键词共现分析,以探明该研究领域的研究热点、重要核心人物和关键文献。

2“五计学”研究的两个核心领域:文献共被引分析

尽管“五计学”的研究目的不同,但他们之间具有十分密切的关系,大部分原理、工具与方法是相同的。随着科学技术的不断发展,计量学从以文献为研究对象向以知识单元为研究对象的知识计量学发展(如图1所示)。图1中共被引文献较多的作者为邱均平,还包括刘则渊(2012)、王崇德(1997)、苏新宁(2007、2008)等,这些文献对“五计学”的发展起到了重要的推动作用。表1列出了文献共被引频次较高的前10篇文献具体情况。

通过表l列出的共被引文献可以看出,对我国“五计学”发展贡献较大的为邱均平,在前10篇文献中有7篇文献属于邱均平所创,这些文献成为“五计学”发展的基础,从这些共被引文献来看,大部分重要文献都与“文献计量学”有关,也符合“五计学”发展的轨迹,“五计学”的发展是随着时间的推移不断完善,大部分理论都是以“文献计量学”为基础。

通过对文献的聚类分析(如图2所示)我们可以观察到,“五计学”的发展分为两个聚类群,一个聚类群是侧重“五计学”的理论发展,而另一个聚类群侧重“五计学”的应用发展。

“五计学”的理论发展主要源于邱均平的“文献计量学”、“信息计量学”和“科学计量学”即“三计学”,而“网络计量学”的发展始于20世纪90年代后期,是文献计量学在网络中的应用。网络计量学主要通过对网上信息的计量研究,为网上信息的有序化组织和合理分布、为网络信息资源的优化配置和有效利用、为网络管理的规范化和科学化提供必要的定量依据,从而改善网络的组织管理和信息管理,最终促进经济效益和社会效益的充分发挥。“知识计量学”是在“文献计量学”、“信息计量学”、“科学计量学”以及“网络计量学”的基础上,对零碎、分散且不系统的知识进行系统化管理,尤其在知识经济和知识管理全球化的时代,知识作为社会竞争中一种重要的战略资源备受人们的重视。“知识计量学”从知识单元的角度出发,对不同领域、不同形态的知识进行系统的研究和分析,对知识的细粒度化进行研究,从基于知识载体的计量转移到对知识本身的计量。

另一聚类群则表现为“五计学”的应用,如文献计量学在人才评价中的应用;信息计量学在科技管理与预测、学科发展中的应用;科学计量学在大学评价及其科研政策制定、科学基金管理、职称评审、技术预见中的应用;网络计量学在期刊评、大学评价、科学交流中的应用;知识计量学在人才评价、科学评价中的应用等等。由此可见“五计学”在文献检索、文献管理、信息检索、信息交流与管理、信息获取、科学研究、科学评价、网络组织、网络信息检索与获取、知识检索与管理、知识发现和知识评价等领域具有广泛的应用。

3“五计学”的研究学者及其更替:作者共被引分析

借助可视化软件CiteSpace,采用最小二乘树算法,节点选择共被引作者,选择默认参数运行软件,得到共被引作者的时区图谱(见表3),图3中的节点在以横轴为时间的二维坐标中体现,可以观察到节点的首次被引用时间及不同时间区域节点的情况。对图3中凸显的作者导出,按作者的频次和突变权重进行排序列出排名前十位的作者,如表2所示。按共被引频次排序,邱均平排在首位,其次有刘则渊、姜春林、王惠翔、赵蓉英等;按突变权重排序,王惠翔排在首位,其次是赵蓉英、华薇娜、李江等学者。他们对“五计学”的发展具有重要的推动作用。通过作者共被引时区图,可以分析出作者的更新情况和相互影响,从时间的维度展示知识的演进情况。早期在“五计学”领域具有相对较高被引频次的共被引作者为邱均平,他对我国计量学的发展起到重要的推动作用,在2000年他发表了7篇关于信息计量学的文献,在2001年发表了6篇关于信息计量学的文献。这些早期的文献都已成为计量学领域发展的知识基础,对“五计学”的发展具有重要贡献。

在Citespace中,通^突变权重揭示研究领域的新趋势和新动态,检测学科内研究兴趣的突然增长,对研究内容突变的动态变化以可视化方式予以呈现。表2列出作者的突变排序,这些突变作者是在某段时间加入“五计学”的研究领域中,并对“五计学”的发展起到推动作用。

4“五计学”的研究热点变化:关键词共现分析

利用可视化软件对我国“五计学”的文献进行关键词共现分析,了解其研究热点。如图4所示,图4中的节点代表“五计学”研究的主要方向,其中最大的节点为“文献计量学”,其次为“引文分析”、“科学计量学”、“信息计量学”、“影响因子”,而“网络计量学”与“知识计量学”的节点并不十分凸显,节点相对较小。而图谱中的“引文分析”、“影响因子”成为“五计学”的重要组成部分,其中有些较大的节点,如“文献计量学”、“引文分析”、“文献计量”等,随着时间的推移已经成为“五计学”发展的知识基础,并不能代表研究的热点领域,而有些相对较小的节点则是“五计学”发展研究的热点内容,如“知识图谱”、“h指数”、“聚类分析”、“补充计量学”等。表3列出了“五计学”关键词的频次和中心性,取前20个关键节点。

在表3中,可以观察到“五计学”研究的热点内容,其中“替代计量学”和“补充计量学”来源于英文Altmet-tics一词,国内学者对其有不同的看法,而出现两种不同术语。列表中的关键词有的代表“五计学”的方法分析,如“聚类分析”、“共词分析”、“引文分析”等;有些代表“五计学”的应用范围,如“期刊评价”、“科研评价”、“学术影响力”等;有些代表“五计学”的理论基础,如“网络计量学”、“信息计量学”、“知识图谱”等内容。

5结论与展望

科学计数法的学情分析第7篇

【摘要题】理论纵横

【正文】

20世纪90年代以后,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络信息计量学(WebmetricsorCybermetrics)就应运而生,用新的研究方法如链接分析法来描述和组织网络信息世界。

1网络信息计量学

网络信息计量学是在网络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:网络计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。网络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。

2链接分析法研究现状

2.1链接分析法的内容

链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法——索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。

2.1.1链接分析法在网络信息组织方面的作用

网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页。一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链接到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点;如果许多重要的网页都指向Yahoo,则其重要程度会更高。这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好——当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。

2.1.2链接分析法在网络信息检索方面的作用

链接分析主要应用于网络信息检索方面,如搜索引擎收集信息、检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots直接访问Web提取出权威页(AuthorityPage)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始网页,Robot从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(NeighborGraph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google等搜索引擎就采用了超链接分析技术来对检索结果排序。2.1.3链接分析法在网络信息资源评价方面的作用

传统的引文分析法在学术方面衡量学术期刊重要性的指标之一是“影响因子”(IF),哪家期刊和论文被引用次数多,影响因子就高,谁就被认为是权威,论文也就是优秀论文。在互联网上IF对应于统计指向某一网页的链接数目后对该网页作出的排序,网站引用分析对应的是某个站点网页被其它站点引用的情况的统计分析,也就是网页可能被其它网站搜索提问命中的结果数的多少,采用计分法和线性代数方法对中心网页和权威网页分数进行迭代求和,以确定权威网页和中心网页。这与百度搜索引擎的创始人李彦宏1996年提出的搜索引擎的第二定律:“人气质量定律”相一致。根据这一定律,用链接分析法进行统计网站被链接和访问次数,可以作为评价网站和网络信息资源质量的一个指标。再加上相应的链接文字分析,就可以用在搜索结果的排序上了,对搜索结果进行的按相关性排序,不完全依赖于词频统计,而是更多地依赖于超链分析。在Internet上链接关系反映的是网页在全世界范围内、同一学科类属的影响力,评价范围是很广的、甚至全球性的。目前主要利用搜索引擎工具在网络上检索网站和网页的链接情况,并按相关性对检索结果进行排序,大大方便了用户在浩

翰的信息海洋中迅速准确地获得有用的信息,易于操作、实用且可以节省用户的时间,在一定程度上可以弥补同行评议等定性方法的缺陷。

2.2链接分析法对情报学研究方法的意义

苏联科学家巴甫洛夫说过:“科学是随着研究方法所取得的成就向前的。研究方法每前进一步,随之我们面前也就开拓了一个充满种种新鲜事物的更辽阔的远景。”情报学是一门新兴的综合性边缘学科,是一个开放的综合性知识体系,它善于吸收其它相关学科的知识和研究方法。上世纪60年代后,随着科学的日益发展,科学研究中应用研究、实用研究和开发研究比重逐渐增大,情报学研究方法体系取得了长足进步,表现在:一是情报研究的领域、对象、内容等的扩大和深化;二是现代科学学科与方法的创立和发展。情报学研究方法体系是动态的、发展的。情报学科要想在原有的基础上实现学科研究模式的更新、学科结构的变革和学科体系的拓展,就必须研究和采用新的思维方式和新的研究方法,及时反映最新的学科学术动态和最新的理论学说,移植、借鉴其它学科的研究方法,如哲学方法、数学方法、社会学方法、经济学方法、信息技术方法等来丰富自己的研究方法,并加以创造和大胆创新,不仅引起自身学科结构的变革和深化学科前沿的研究,而且不断发展新的分支学科,促使学科研究充满时代气息。

链接分析法大大拓展了信息计量学在网络环境下的应用,充实了网络信息计量学的内容,是情报学研究的新领域,完善了情报学方法论体系。它是情报学逐渐成熟的一个重要历程碑,标志着情报学理论方法的一个新的飞跃。

2.3链接分析法目前存在的问题

在文献计量学中,传统的引文分析法只要统计参考文献数据就可完成引文分析的任务,但是在互联网上,链接分析法的研究对象是网络信息资源,网络信息资源覆盖范围广、动态性强,具的信息量巨大、不确定性、缺乏合理组织、难以预测等特点,且信息过载(InformationOverload)和信息污染(InformationPollution)现象严重;引用与被引用关系也变得十分复杂;链接分析法的适用范围也是有限的;Internet是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。因此,在使用链接分析法时要充分考虑以上问题,尽大可能保证其结果的可靠性。

3结束语

由于链接分析法借鉴了引文分析法的方法和思路,是情报学研究方法在网络环境下新应用,目前链接分析法主要实验工具是搜索引擎,但随着网络信息技术如人工智能、网络信息检索、计算机网络、知识挖掘、自然语言处理等的发展,必将为链接分析法的研究和开发应用提供更为有力的支持。情报学也必将充分利用网络信息技术,吸收其它学科的先进方法来深化、完善自己的方法论体系,建立起更为完善的体系结构,从而改变情报学学科的面貌。

【参考文献】

1徐久龄等.网络计量学的研究.情报学进展1998-1999年度评论,第三卷.北京:航空工业出版社,1999:78-105

2夏旭等.网络计量学研究:现状、问题与发展.图书馆论坛,2001,(12):44-47

3邹志仁.论情报研究方法体系.江苏图书馆学报,1990,(2):18-23

4杨涛.链接分析法存在的问题及改进方法.图书情报知识,2002,(3):62-63

5刘雁书,方平.Web网站站外链接类型与特征调查-链接分析法可行性研究.大学图书馆学报,2001,(5):65-68

6邹菲.试论网络信息计量学在数字图书馆中的应用.图书情报知识,2001,(1):16-17,20

7邱均平.信息计量学(一).情报理论与实践,2000,(1)