欢迎来到优发表,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

SCI投稿辅导 SCI发表咨询

面向Deep Web本地化数据集成的数据源两层选择模型

作者:鲜学丰; 崔志明; 方立刚; 顾才东; 孙逊 江苏省现代企业信息化应用支撑软件工程技术研发中心; 江苏苏州215104; 苏州大学智能信息处理及应用研究所; 江苏苏州215006

摘要:针对基于数据源质量选择方法的数据源在数据爬取时存在代价大、重复率高的问题,提出一种结合两层选择模型的Deep Web数据源选择和集成方法。该方法根据数据源本身质量和数据源的效用构建数据源的两层选择模型。给出基于该模型的递归增量数据源选择和集成策略,采用基于数据源质量的选择器过滤大量低质量Deep Web数据源,仅选择若干个高质量的数据源作为第2层选择器的输入。从候选数据源集合中递归地选择,使集成系统在获得尽可能多的高质量数据的同时,避免出现较高覆盖率的k个数据源,作为集成系统最终需要爬取和集成的数据源。实验结果表明,该方法结合两类选择器的优点,缩减了候选数据源的空间并保证集成数据的质量,同时避免了系统处理大量重复数据,有效降低Deep Web数据爬取与集成的代价。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程

北大期刊 下单

国际刊号:1000-3428

国内刊号:31-1289/TP

杂志详情
相关热门期刊
  • 建材发展导向
    北大期刊 下单

    国际刊号:1672-1675

    国内刊号:53-1185/TU

  • 作文大王
    北大期刊 下单

    国际刊号:1009-7813

    国内刊号:45-1283/G4

  • 金融与经济
    北大期刊 下单

    国际刊号:1006-169X

    国内刊号:36-1005/F

  • 辽宁林业科技
    北大期刊 下单

    国际刊号:1001-1714

    国内刊号:21-1107/S

服务介绍LITERATURE

正规发表流程 加急见刊

多年专注期刊服务,熟悉发表政策,投稿全程指导。因为专注所以专业。

保障正刊 双刊号

推荐期刊保障正刊,评职认可,企业资质合规可查。

用户信息严格保密

诚信服务,签订协议,严格保密用户信息,提供正规票据。

不成功可退款

如果发表不成功可退款或转刊。资金受第三方支付宝监管,安全放心。