《A Survey on Deep Learning forNamed Entity Recognition》

论文链接

  • NER是信息抽取、问答系统、机器翻译的一项基础工作,DNN的应用让NER任务有了长足的进步
  • NER分为两类coarse-grained NER:比较粗粒度的划分entity,比如通用NER。 fine-grained NER:更加细分的实体类型,通常是和具体的业务相关的实体,一个mention可以属于多个实体类别
  • 数据集:见原文table1。 比较常用的有:
    • OntoNotes:18 coarse entity type consisting of 89 subtype
    • CoNLL03 4 entity types
  • 工具:见原文table2 StanfordCoreNLP/NLTK/spaCy
  • 评价指标:
    • exact-match evaluation: 用全匹配方法计算F1。会有些偏严,指标偏低
    • relaxed-match evaluation: 宽松匹配方案,不太好控制
Read more