百度ERNIE再立战功 夺下权威语义评测5项世界冠军

作者:张伟 来源:原创 2020-03-30

  近日,全球规模最大的语义评测比赛 SemEval 2020 结果出炉,该赛事是全球范围规模最大、参赛人数最多的权威语义评测竞赛,由国际计算语言学协会的SIGLEX主办。

  在本次结果中,百度基于飞桨平台自研的语义理解框架 ERNIE再立战功,一举斩获 5 项世界冠军。其中在视觉媒体的关键文本片段挖掘比赛中,ERNIE以 5 项指标全部第一的成绩拿下冠军宝座。

  该比赛旨在自动挖掘海报、广告、传单等视觉媒体中文本的关键片段,对其进行重点设计,提升宣传效果。由于人们对于同一文本重要内容的判断不一致,在没有唯一标准的情况下,该任务存在极大的难度。

  ERNIE模型作为语义信息提取模块,对各片段重要性进行建模。并针对关键片段标准不统一的问题,设计了更贴近目标的 5 Label 的 Pairwise 损失函数,最终从数据出发构造了多种针对性的语义特征以及数据增强策略。

  其次在多语攻击性语言检测、以及混合语种的情感分析中,ERNIE也同样排在了第一的位置。在这些殊荣的背后,得益于ERNIE在去年完成的版重大升级。

  ERNIE 1.0提出知识增强的语义表示模型,而 ERNIE 2.0则构建了持续学习语义理解框架,在中英文16个任务上超越业界最好模型。此后,ERNIE 模型再次改进,以历史上首次超越90大关的成绩登顶自然语言处理领域最权威的 GLUE 评测榜单。

发布
X
第三方账号登录
  • 微博认证登录
  • QQ账号登录
  • 微信账号登录

企业俱乐部