论文:Query2Box: Reasoning over Knowledge Graphs in Vector Space using Box Embeddings

ICLR 2020的一篇论文,和论文Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs是相关的文章,有完整代码

作者:Hongyu Ren, Weihua Hu, Jure Leskovec

pdf:https://arxiv.org/abs/2002.05969

github:https://github.com/snap-stanford/KGReasoning(包含三种模型,BetaEQuery2boxGQE

0. Abstract

本文是BetaE的前身,仅提供了EPFO查询,没有提供否定查询。本文提出的Query2Box框架,比[上一篇文章]()增加了析取(也就是或)查询

Query2Box框架,将查询嵌入为框(即超矩形),框内的实体为答案实体。在此设定下,连接就是框的交叉部分。但经过证明发现,框嵌入需要与实体数量成正比的维度才能进行有效表示。本文将给定的EPFO查询转换为析取正常形式 Disjunctive Normal Form,DNF,最后解决了这一问题

在三个大型知识图谱数据集上,实现了25%的提升,取得了SOTA

1. Introduction

本文认为,过去工作将查询嵌入到向量空间中的单点,这样无法很好地实现活动实体建模(如图一C),也无法较好地在向量空间中定义两点的逻辑运算符

本文的Query2Box框架使用一个框表示查询,好处如下:

  • 框自然对所包围的实体建模
  • 逻辑运算符可以自然地在框中定义,类似维恩图的框
  • 对框进行一阶逻辑运算会产生新的框,说明是闭运算。迭代进行运算更新框,可以进行逻辑推理(如图一B、D)

框嵌入需要与实体数量成正比的维度进行表示。为解决这一问题,本文将给定的EPFO查询转换为析取正常形式 Disjunctive Normal Form,DNF,即连接查询的分离,也就是,先处理单个框嵌入问题,最后取答案实体的连接。

最后的实验证明:

  • Query2Box泛化能力很强,可以回答复杂查询
  • Query2Box可以泛化出训练期间未出现的逻辑查询结构(也就是能正常运算)
  • Query2Box能隐式填补缺失关系
  • Query2Box比此前的SOTA提高25%的效果
image-20201106093548624
  • 图一:Query2Box框架过程图。图一构建一阶逻辑查询DAG图;图二构建计算图;图三在知识图谱空间遍历知识图谱,活动实体建模;图四在向量空间嵌入查询,获取答案实体

2. Further Related Work

  • 知识图谱多跳推理的嵌入方法:本文与此前工作的区别是,本文实现了更丰富的一阶逻辑推理,同时将查询嵌入为框,实现了更好的效果
  • 结构化嵌入方法:本文与此前工作的区别是,本文的框嵌入与实体嵌入是共同学习的,从而允许推理不完整的知识图谱

3. Query2Box: Logical Reasoning Over KGs in Vector Space

3.1 知识图谱和连接查询

image-20201106093616928