《Neural Open Information Extraction》

论文链接

  • 目标:从输入文本中抽取schema-free的spo三元组
  • 模型:
    • encoder-decoder的seq2seq模型
    • 原文输入encoder,得到一个encoded embedding
    • 目标序列格式为subjectpredicationobject
    • 引入copy机制,从生成的token和copy的token中选择一个
    • architecture:architecture
  • 实验:
  • 启发:
    • 做openie的工作,不仅仅可以用NER+NRE的传统方案,还可以考虑seq2seq的方案
    • seq2seq需要引入copy机制确保生成原文中出现的词语
    • 这种方案可以解决predicate不是原文中连续的一段文本的情况
    • 可以引入transformer来做生成,提高效果
    • 在做decode的时候,可以引入图谱embedding,ner embedding,提高效果
    • 后续可以改进做一个句子中有多个SPO的抽取

《Neural Open Information Extraction》

http://example.com/2020/07/02/nlp/neural_openie/

Author

jerrychen

Posted on

2020-07-02

Updated on

2022-01-05

Licensed under

Comments