一种相似重复元数据记录检测方法
作者:王常武 韩菁华 张付志 燕山大学信息科学与工程学院 秦皇岛066004
摘要:对联邦数字图书馆中重复元数据记录进行检测和管理,是保证元数据质量、提高联邦检索服务质量的关键。针对现有联邦数字图书馆中重复记录检测方法计算集中、准确度不高等缺点,提出一种快速高效的相似重复元数据记录检测方法,该方法基于改进的N-Gram方法,适合较大规模联邦数字图书馆。模拟实验结果表明,该方法能有效提高重复检测的性能,加快重复检测的速度。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社