摘要:针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于3623篇手机评论文章,利用该方法可获得1732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社