常毅教授指导的2021级博士研究生夏婷玉同学的论文"FastClass: A Time-Efficient Approach to Weakly-Supervised Text Classification" 被国际会议EMNLP 2022(清华推荐A类,CCF B类)接收为长文 (Main conference)。本篇论文与美国北卡罗莱纳州立大学教堂山分校王悦助理教授和公司田原准聘副教授合作完成。
会议简介:EMNLP(Conference on Empirical Methods in Natural Language Processing)是计算语言学和自然语言处理领域的顶级国际会议,由ACL SIGDAT(语言学数据特殊兴趣小组)主办,每年举办一次,Google Scholar计算语言学刊物指标中排名第二。EMNLP 2022将于2022年12月09日至11日在阿拉伯联合酋长国阿布扎比及在线会议的形式同时举办。
会议类别:清华推荐A类,CCF B类会议
会议时间:9th–11th December 2022, Abu Dhabi
第一作者:夏婷玉
论文题目:FastClass: A Time-Efficient Approach to Weakly-Supervised Text Classification
论文概述: 弱监督文本分类的目的是只使用类别描述和未标记的数据来训练一个分类器。最近的研究表明,关键词驱动的方法可以在各种任务上取得最先进的性能。然而,这些方法不仅要依靠高质量的类描述来获得特定的类关键词,而且还需要大量的未标记数据,同时需要花费很长的时间来训练。本文提出了一种高效的弱监督分类方法FastClass,与关键词驱动的方法相比,该方法对初始类描述的依赖性较低。在多个分类任务上的实验表明,我们的方法经常超过关键词驱动的模型,同时享有更快的训练速度。