Hierarchical Graph Network for Multi-hop Question Answering
EMNLP2020的一篇论文,涉及Multi-hop QA和Hotpot Dataset,有完整代码
- 作者:Yuwei Fang, Siqi Sun, Zhe Gan, Rohit Pillai, Shuohang Wang, Jingjing Liu
- pdf:https://arxiv.org/abs/1911.03631
- github:https://github.com/yuwfan/HGN
0. Abstract
本文提出了一种用于多跳问答的层次图网络HGN
为了聚合多个段落中分散文本的线索,通过构建不同粒度级别的节点,创建层次图
- 节点包括:查询、段落、句子、实体
HGN
表示部分,采用预训练的上下文编码器进行初始化,通过图迭代进行更新
HGN
多跳推理部分,通过遍历序列子任务图实现不同子任务
- 子任务包括:段落选择、支撑事实抽取、答案预测
通过将不同粒度的节点构建成一个图,使HGN
能同时支持不同问答任务
模型在HotpotQA
数据集上取得了SOTA
1. Introduction
为解决多跳推理查询,模型需要实现:
- 确定与查询相关的段落
- 找到支撑证据
- 确定正确答案
本文提出了HGN
模型,涉及4种图节点,查询
、段落
、句子
、实体
。首先用预训练上下文编码器BERT
或RoBERTa
进行初始胡,随后通过图神经网络进行图传播,迭代更新。更新后的节点用于不同子任务,段落选择
、支撑事实预测
、答案预测
。模型采用跨度预测模块实现最终答案预测。
本文主要贡献包括:
- 提出了用于多跳查询回答的
HGN
模型,异构节点共同构建一个图 - 对于不同子任务,不同粒度节点相互则国强,为支撑事实提取和答案预测提供有效监督信号
HotpotQA
数据集中,Distractor
和Fullwiki
均取得了最好成绩

Comments | NOTHING