Relation Extraction实验过程记录


2018.10.24

之前主要是做了一些数据处理方面的工作,搭好了公司这边的一台GPU的机器,然后做了一个简单的实验。

实验主要是使用textcnn对句子进行分类,纯文本分类的方法用到关系抽取的任务上来。效果果然不好:

type loss acc
train 0.02 0.99
vld 2.17 0.62
test 2.5 0.52

猜测是纯文本分类的方法(使用cnn)work是因为句型句式中包含了一些分类能用得上的信息,对于关系抽取这种句式多变没有特定的句型的任务就不work了,所以导致很严重的过拟合。如图:

然后加上了entity本身第一个词语和句子各个词语对两个实体的相对位置序列,效果有一点点提升,提前终止:

type loss acc
train 0.69471 0.75679
vld 0.82529 0.72166

下一步工作:

  • Nguyen, (2015). Relation Extraction: Perspective from Convolutional Neural Networks.
  • 加上Rank Loss
  • lstm的尝试
  • 加上self-attention
  • 使用transformer
  • 使用新出的bret