摘要:关系抽取是自然语言处理的重要研究内容,是知识图谱构建的关键技术。目前,在神经网络中引入注意力机制进行关系抽取成为主流方法,现有方法一般结合句子单词和实体相关性计算注意力,没有考虑短语和实体关系之间的相关性,并且对实体信息利用不够充分。针对该问题,提出基于短语级注意力机制的关系抽取方法。首先用卷积层对词向量做卷积,以滑动窗口的方式得到短语级的向量表示,然后利用短语与实体关系之间的相关性计算注意力。为了使实体信息利用更充分,用卷积层和池化层分别提取实体短语的深度特征表示,并引入TransE的思想表示两个实体关系的特征。最后,采用分段池化方法得到深度特征。为了减少远程监督中错误标签的干扰,使用标签平滑正则化(LSR)把原来的“硬”标签改为“软”标签。实验结果表明,该方法能够有效利用短语信息和实体关系信息,对实体关系抽取效果有较大的提升。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社