常毅教授指导的公司2019级硕士研究生王博同学的论文"Structure-Augmented Text Representation Learning for Efficient Knowledge Graph Completion "被CCF-A类会议WWW 2021接收。
王博本科就读于伟德bevictor中文版软件学院卓越工程师班,2019年保送到公司攻读硕士,从研究生一年级起开始接受常毅老师与悉尼科技大学的联合指导,从事自然语言处理与知识图谱领域的研究工作。本工作与悉尼科技大学的Guodong Long教授、Tao Shen博士合作完成。
第一作者:王博
论文题目:Structure-Augmented Text Representation Learning for Efficient Knowledge Graph Completion
会议名称:30th The Web Conference (WWW 2021)
会议类别:CCF A类会议
会议时间:April 19-23, 2021, Ljubljana, Slovenia.
会议背景:WWW,全称为国际万维网大会(The Web Conference) ,是互联网技术领域最重要的国际会议之一,由国际万维网会议委员会(IW3C2)和主办地地方团队合作组织,每年举办一届。万维网(World Wide Web)的构想最早由英国软件天才蒂姆·伯纳斯-李(现为美国麻省理工学院研究员、英国南安普顿大学计算机系教授)于1989年3月向欧洲核子研究中心主管提出,被公认为是促使互联网迅速发展的重要发明。互联网的诞生早于万维网15年,但起初因使用技术复杂难以普及。万维网借助超文本链接,把不同电脑上的文本、图像、声音等文档链接在一起,使人们不必受电脑操作系统类别和地域等限制,即可自由浏览和分享信息,互联网的操作因而大大简化。
论文简介:本文致力于知识图谱补全领域,考虑到现存知识图谱补全方法的弊端,即图嵌入方法泛化能力差以及文本编码方法缺乏结构化知识且计算开销过大的问题,提出一种结构增强的文本表示学习方法,实现了两大类方法的优势互补。具体地,本文基于孪生网络结构,采用预训练语言模型做编码器以充分利用实体和关系的文本信息,并提出两种评分策略以同时建模上下文和结构信息。此外,本文提出了一种自适应集成方案,将两大类方法的得分做出自适应融合,进一步提高了知识图谱补全的性能。实验结果显示,我们的方法能够有效提高知识图谱补全的性能、速度和泛化能力。