计算机科学与技术专业2013级本科生何杭峰
今年四月初,我在学院的资助下参加在西班牙瓦伦西亚举行的The European Chapter of the Association for Computational Linguistics (EACL) 2017会议,并在会议中为我的论文《F-Score Driven Max Margin Neural Network for Named Entity Recognition in Chinese Social Media》和《Neural Networks for Negation Cue Detection in Chinese》做报告并同时参与作为共同作者的论文报告《Detecting negation scope is easy, except when it isn't》。
EACL是自然语言处理领域欧洲顶级会议,会议涵盖了自然语言处理领域的众多核心问题,是世界各地尤其是欧洲计算语言学家交流和学习的重要场所。
我的工作包括在北大完成的有关社交媒体上命名实体识别任务以及在爱丁堡完成的否定词识别以及参与的工作否定词作用域识别。1.对于命名实体识别,我们采用sequence tagging的方法进行识别,使用B(begin NE),I(inside NE),O(outside NE)但是通常方法大多利用label accuracy来进行训练。但是评价指标使用的是Precision, Recall and F-score,其中主要是F-score。所以,我们通过修改max margin的margin函数计算来达到直接在F-score上训练的目的。2.对于Negation cue detection,我们采用BiLSTM + CRF的模型,在此模型上,我们重点分析了三个Scientific literature,Product Review and Financial article 不同领域语料进行错误分析,来理解神经网络的优劣,以及改进方向。同时,我们也实现了,用尽可能少的highly-engineered feature来实现最优效果。3.对于Negation scope,我们对中英文语料进行错误分析,并总结出一些pattern,针对pattern设计了一些针对性改进方案。
我充分利用会议时间,和相关教授请教学术问题。比如,我参与了我的未来博士导师主讲的tutorial 《integer linear programming in NLP》,并讨论了相关问题。还有,我有幸再次相遇爱丁堡暑期科研的导师和师兄,并共同准备了相关报告。
这是我本科期间第二次参见国际会议并报告,两次出访均得到了信息学院的大力,这让我深感学院对本科生科研活动的大力支持。再次对学院表示感谢。