论文:Embedding Logical Queries on Knowledge Graphs

NIPS 2018的一篇论文,和上一篇论文Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs是相关的文章,有完整代码

作者:William L. Hamilton, Payal Bajaj, Marinka Zitnik, Dan Jurafsky, Jure Leskovec

pdf:https://arxiv.org/abs/1806.01445

github:https://github.com/snap-stanford/KGReasoning(包含三种模型,BetaEQuery2boxGQE

0. Abstract

本文是BetaE的初代前身,仅提供了连接逻辑查询

本文提出一种方法,将图节点嵌入到低维空间中,并将逻辑运算符表示为该嵌入空间中的几何操作(如,转换、旋转),并在低维嵌入空间执行逻辑运算,实现与查询变量呈线性的时间复杂度。

本文在两个现实世界数据集上证明了框架的实用性,包括:

  • 药物-基因-疾病关系预测数据集
  • 社交网络关系预测数据集

1. Introduction

知识图谱中预测关系的任务包括:

  • 链路预测
  • 推荐系统
  • 知识库完成

本文采用的是预测关系任务中的重要方法:连接查询 conjunctive queries,仅包含连接 conjunctive存在 existential运算符,不包含BetaE中的量化 quantification析取 disjunction取反 negation运算符。

预测关系任务,采用蛮力法需要逐个预测节点间存在关系的可能性。本文提出了一种改进方法,即图查询嵌入 GQE方法。这是一种基于嵌入的框架,可以有效地对不完整知识图上的连接查询做出预测

GQE的原理是将图节点嵌入到低维空间中,并将逻辑运算符表示为该嵌入空间中经过学习的几何操作(如旋转、平移),训练后,可以用该模型预测哪些节点满足连接查询。该方法具有线性时间复杂度

image-20201105202811599
  • 图一是连接查询示意图

2. Related Work

本文相关工作包括:

  • 逻辑推理和知识图谱:包括知识图谱嵌入、概率软逻辑、可微逻辑推理。本文主要贡献是,强调直接对连通逻辑查询做出预测,而不是关系预测;强调逻辑形式推理,而不是自然语言理解
  • 概率数据库:本文主要贡献是,通过现有概率数据库预测关系
  • 神经网络证明:本文主要贡献是,实现了一种嵌入一阶逻辑的方法,并证明了可扩展性

3. Background and Preliminaries

本文提供了两个现实世界数据集:Drug interactionsReddit dynamics

  • Drug interactions:97000个节点,超过800万个关系
  • Reddit dynamics:超过70万个节点,超过400万个关系
image-20201105204405714