SMORE: KNOWLEDGE GRAPH COMPLETION AND MULTI-HOP REASONING IN MASSIVE KNOWLEDGE GRAPHS —— 论文阅读笔记

Jure 实验室最新的一篇论文，应用了他们实验室的最新技术。

代码：SMORE

0. 摘要

本文提出了 SMORE 框架（Scalable Multi-hOp REasoning），通过它可以在 Freebase 这样的超大型知识图谱上进行多跳推理。

SMORE 框架的核心是双向拒绝抽样，能够实现在线训练数据生成时的复杂性平方根降低（achieves a square root reduction of the complexity of online training data generation）。

此外，SMORE 框架还采用了基于 CPU 的重叠数据采样，基于 GPU 的嵌入计算和内存显存输入输出方法。

SMORE 框架可以通过很少的 GPU 内存需要（2GB 训练 400 维的有 86M 节点数据的 Freebase），速度达到 SOTA 框架的 2.2 倍，同时速度随着 GPU 数量增加线性增长。

同时，SMORE 在常用知识图谱上可以在单 GPU 和多 GPU 上都能取得比较好甚至更好的效果。

文章采用对比学习的方法，训练查询嵌入方法的模型，进行多跳知识推理。

基于嵌入的推理方法：训练一系列神经逻辑运算符（例如否定运算符），然后对输入实体进行计算，获得输出实体，通过这样的过程进行查询。
对比学习用于知识推理：构建 (q, A, N) 三元组，包含查询，答案实体和负例实体。优化目标是最小化查询嵌入和答案实体嵌入距离，最大化查询嵌入和负例实体距离。其中，由于大规模知识图谱上的多跳知识推理涉及到大量实体，因此如何构建三元组就是难题。

因此，本文认为对比学习用于知识推理最重要的是如何快速生成大量对比学习样例。

对此，本文提出的方法是双向拒绝抽样。为什么叫这个名字呢？可以看它的方法。

A. 查询结构选择：首先选择查询结构模板中的结构。
B. 生成查询：随后选择一个实体作为答案实体（根节点），开始根据查询结构生成树状结构。关系（树的边）也是随机选择的，最后到达锚实体（叶子结点）。通过这样的方式，反向构建查询。
C. 前向缓存：从锚实体出发，朝着 node cut 的位置查找，并缓存查找过程中路过的实体。这里的 node cut 意思就是能够截取所有锚实体（叶子节点）到答案实体（根节点）的节点组合。如果定义 node cut 是最小的，也就定义了 node cut 的最小的节点组合，任何更小的节点组合都不再是 node cut，不能拦截所有锚实体和答案实体之间的路径了。也就是说，node cut 是从锚实体出发找到答案实体的路径的一环，不能避开。同时，由于查询结构是固定的，对应的 node cut 的位置也是固定的，所以查询时知道什么时候到达了 node cut 应该所在的位置。
D. 反向验证和拒绝抽样：从答案实体出发，朝着 node cut 的位置查找，并缓存查找过程中路过的实体。其中与前向缓存的实体重叠的实体，对应的答案实体就是正例，反之则是负例。
E. 基于遍历的抽样：此前的方法，时间复杂度可以看出来是节点出度的平方。相比之下，本文的方法是节点出度的线性。

图：查询嵌入方法的目标是，对于多跳查询问题（子图 A），通过执行嵌入空间的查询计算方案避免盲目的多跳推理移动（子图 B），同时查询嵌入方法还能够比较好地应对知识图谱中的缺失路径问题（子图 C）。

图：查询嵌入方法，首先选择查询结构（子图 A），随后根据答案实体，反向生成查询（子图 B）。随后从锚实体出发，朝着 node cut 方向查找，将所有到达 node cut 应该在的位置的实体进行求并集，得到候选实体集合（子图 C）。同时，从答案实体出发，朝着 node cut 方向查找，如果到达 node cut 位置的实体也在候选实体集合中，就说明该答案实体是正例，反之则是负例（子图 D）。与 SMORE 框架的线性时间复杂度相比，常规的基于遍历的样例抽取方法的时间复杂度要高得多，达到了平方级，不适合大规模知识图谱（子图 E）。