Web权威信息自动提取技术的研究及应用
作者:李净 袁小华 沈晓晶 上海水产大学信息学院 上海200090 同济大学电信学院 上海201804
摘要:WWW为各行各业提供了大量的信息,但如何准确地从这些信息中提取出相关领域的权威信息是目前研究的热点问题之一。该文提出评判网站信息的多因素综合评估模型,该模型对网站的权威值进行合理计算,给出基于表格数据的语法树模型,完成了表格数据的自动提取。通过实例证明,该方法很好地解决了权威信息的准确和自动提取。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社