KGQA论文笔记（三）

论文：Query Graph Generation for Answering Multi-hop Complex Questions from Knowledge Bases

ACL 2020 的一篇论文，与Multi-hop QA相关，有完整代码。

作者：Yunshi Lan, Jing Jiang
pdf：https://arxiv.org/pdf/2002.05969.pdf
github：https://github.com/lanyunshi/Multi-hopComplexKBQA

0. Abstract

知识库问答主要包括两种复杂问题：

具有约束的问题
具有多跳关系的问题

本文同时处理两种复杂性，提出了一种改进的分段查询图生成方法。通过早期将约束并入查询图中，可以更有效地对搜索空间进行剪枝。在三个数据集上取得了SOTA

1. Introduction

两种不同的复杂问题及对应处理方法：

具有约束的单一关系问题：例如谁是美国的第一任总统，第一是一个约束。对这种问题，一般采用阶段查询图生成方法，首先识别单跳关系路径，随后添加约束，形成查询图
具有多跳关系的问题：例如Facebook的创始人的妻子是谁，的妻子和的创始人是两个跳跃。主要问题是，如何限制搜索空间。一种思路是，采用波束搜索 beam search，这是一种启发式搜索方法和贪心方法，通过扩展实体集合中最有希望的节点来探索查询图。

本文将约束和多跳关系一起处理，而且不是先构建查询路径再添加约束，而是同时合并约束和扩展关系路径，从而约束搜索空间

2. Method

2.1 预定义

本文的方法主要基于现有的阶段查询图生成算法。查询图query graph有四种节点：基准实体grounded entity 图中的阴影矩形代表查询中出现的实体，存在变量existential variable 图中的无阴影矩形代表未确定实体，lambda变量lambda variable 图中的圆圈代表答案，聚合函数aggregation function 图中的菱形

阶段查询图构建算法包括以下四步：

首先从问题中找到的grounded entity，这里指的是topic entity，找到一条连接grounded entity和lambda variable的core relation path
随后向core relation path添加约束，可以是grounded entity，也可以是aggregation function
根据以上两步获取的查询图，通过神经网络，将查询图与查询的相似度进行排序
根据知识图谱，执行排序靠前的查询图，获得答案实体

2.2 动机

由于阶段查询图构建算法之前对应的是单跳问题，因此需要扩展到多跳问题，要考虑如何修剪搜索空间。采用波束搜索beam search可以解决问题。本文发现，约束也可以帮助修剪空间。融合了约束修剪、beam search修剪和语义匹配模型修剪的模型，具有更好的效果

个人思考，加入了约束的修剪之后，beam search就不容易将答案路径给修剪掉了，能进一步提高了搜索的精度
例如：上图的The Jeff Probst Show，如果只考虑与它相关联的实体，也就是在y2处扩展关系图，搜索空间较大。而如果加上约束TV producer，则只需要考虑有约束的相关实体，可以很好地修剪空间

2.3 查询图生成

查询图生成包含三种操作。每次都用2.4节介绍的得分函数对查询图进行排序，并保留得分最高的查询图进行下一步的查询图生成

扩展extend：如果查询图里只有topic entity，则topic entity相连的关系路径的另一端变成lambda variable；如果查询图里有lambda variable，则lambda variable先变y，y相连的关系路径的另一端变成lambda variable x
连接connect：查询过程中可能会发现topic entity以外的、出现在查询中的grounded entity e。这时连接操作将e连接到lambda variable x或与x相连的existential variable，也就是CVT node。通过执行当前查询图，获取x或CVT node到e的连接关系
聚合aggregate：使用一组预定义的关键词从查询中检测聚合函数，将检测到的聚合函数作为新节点连接到x或CVT node

文中提到，本文的方法允许扩展操作在连接和聚合操作之后再进行。这是此前的方法不允许的

注：只考虑x和CVT node，是因为路径中的其他节点已经考虑过了

2.4 查询图排序

第t轮迭代结束后，推导每个查询图g的7维特征向量vg，并将向量输入一个完全连接层，通过softmax获取p(g|Q)（这里可以思考，可否换成p(Q|g)）

vg第1维是基于BERT的语义匹配模型提供的标签序列。忽视lambda variable和existential variable，根据行动顺序构建标签序列。例如，下面的标签序列是（the, jeff, probst, show, nominated, for, nominee）

vg的其他6个维度，第1维是查询图中所有grounded entities的累计实体链接得分，第2维是查询图中grounded entities的个数，第3维是实体种类数，第4维是时态表达数，第5维是最级表达数（最高级、最低级），第6维是查询图中的答案实体个数
为什么采用时间和最级特征，这个可以思考一下

2.5 学习过程

训练模型时，提供的是查询和对应答案，而不提供具体标记过的查询图。基于这篇论文的思路，采用强化学习算法，采用端到端学习的方式，学习策略函数pθ(q|Q)。其中，θ是需要学习的参数，包括BERT参数和全连接层参数。选择F1值作为强化学习奖励

3. Experiment

3.1 实施细节

首先需要从问题中进行命名实体识别，以及实体链接（包括命名实体链接和实体类型链接）
命名实体识别采用的是开源工具
命名实体链接，对CWQ数据集，采用开源工具。对其他两个数据集，采用他们已经提供的链接
实体类型链接，通过给定查询和对应答案，学习链接模型。其中，对于时态表达和最级表达，只采用正则表达式和最级单词列表进行链接。最级表达采用手动映射方式映射到两个聚合函数：argmax和argmin
知识图谱采用的是Freebase
初始化，vg的第1维采用的是BERT预定的参数，其他是随机初始化

3.2 数据集

ComplexWebQuestions CWQ
WebQuestionsSP WQSP
ComplexQuestions CQ
采用CWQ作为主要数据集，因为其中超过30%的问题同时包含2-hop和约束。其他两个数据集同时包含的比较少

3.3 比较方法

现有的阶段查询图生成算法（无法处理多跳问题）
不采用beam search的方法
不采用约束剪枝的方法
问题分解方法
令牌标记方法

3.4 结果

3.5 消融实验

用LSTM替换BERT，结果依然最优
对三个动作分别进行了消融实验，证明扩展最重要，聚合最不重要，但都有作用

3.6 误差分析

查询图错误最多，实体或表达式链接错误其次，查询图策略问题最次

4. Conclusion

本文提出了一种改进的阶段查询图生成方法，可以处理具有多跳关系和约束关系的复杂问题。通过早期将约束整个到查询图中，结合波束搜索beam search，从而限制搜索空间大小。在三个现有复杂问题数据集中取得了SOTA，尤其提高了ComplexWebQuestions的效果

论文分析

论文很短，信息量却挺大的。采用强化学习的方法实现查询图构建，值得思考