《TPLinker:Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking》

论文链接

解决的问题

给定schema的SPO抽取:从文本中抽取去SPO(Subject-Predicate-Object)三元组。其中Predicate是事先定义好的关系,Subject和Object是文中的span

TPLinker的特点

  • 能够处理SEO(SingleEntityOverlap)和EPO(EntityPairOverlap)两种情形
    • SEO:张三和李四都是北京人 -> (张三,出生地,北京),(李四,出生地,北京)
    • EPO:江苏的省会是南京 -> (江苏,包含,南京),(江苏,省会,南京)
  • Single-stage的方案,原始文本过一次Encoder之后,便可以解码得到整个spo三元组
Read more