《Grid Tagging Scheme for Aspect-oriented Fine-grained Opinion Extraction》论文阅读

文章介绍

  为了完成ASTE方面级情感分析任务的三元组提取,很多的方法都通过流水线的方式首先提取方面词或意见词,然后形成方面-意见词对的形式,最后判断情感极性。虽然这样的方法可以充分训练每一个独立的模型,但也不可避免地会受到错误传播的影响。因此作者设计了一个全新的网格化标记方案( Grid Tagging Scheme,GTS),从而端到端完成该项任务。除此之外,作者分别基于CNN、BiLSTM和BERT实现了三种不同的GTS模型,证明了其框架的有效性。

Grid Tagging Scheme

问题定义

  这里作者是分别介绍了两项任务。首先对于OPE任务,其主要目的为提取方面实体-意见词对的两元组。对与OTE任务,其在OPE任务的基础上进一步提取对应的情感极性。

标注方案

  GTS一共使用4种标签{A, O, P, N}来代表一个词对之间的关系,含义如下所示:

  对于OPE二元组任务,标签P代表的是这个词对中一个词来自于方面实体,另一个词来自于意见词。

  对于OTE三元组任务,则会把情感标签P替换成情感极性,所使用的标签集合为{A, O, Pos, Neu, Neg, N},如下图所示

解码算法

  有了标注方案以后,怎么从原始文本转化为标注方案的这种形式便是这一节所要讲述的问题。

  对于OPE二元组任务,其大致思想为,检测连续的方面实体并打上标签A,检测连续的意见词打上标签B,然后遍历这两个集合从而组成方面实体-意见词对

  对于OTE三元组任务,上述算法的第11-15行会有所改变,会将对上述词对预测最可能的情感标签作为其情感极性,如果情感标签是无效的,则可以推断出这个情感词也是无效的。

模型验证

  首先作者提出的模型框架如下图所示

  为了获得词对之间的联系,作者在编码层的基础上应用了注意力机制,公式如下

  同时为了更好的应用词对中的词语其他词之间的联系,作者这里还额外设置了一个推理策略。例如,如果由wi组成的词对的预测标签包含A,则词对(wi,wj)的标签不太可能是O,反之亦然。第二,先前对(wi,wj)的预测可以帮助推断出当前回合的(wi,wj)标签。具体公式如下所示:

训练损失

  最后的损失就是用的交叉损失熵

文章地址:https://arxiv.org/abs/2010.04640