BETVLCTOR伟德官方网站系列学术活动(第17场)——北卡罗来纳大学教堂山分校信息与图书馆科学学院王悦助理教授学术报告

发布时间:2022-04-01 点击:

题目:面向专业搜索任务的可解释信息检索模型

摘要:在专业搜索任务中,如精准的医学文献搜索,一个查询往往涉及多个方面的信息。为了评估一个文献的相关性,搜索者必须不厌其烦地验证查询中的每一个方面,并遵循特定任务的逻辑来做出相关性的判断。在这种情况下,搜索者所做的相关性判断是解构化的,而不是传统的单变量(二元或分级)的相关性判断。理想情况下,搜索引擎应该可以支持搜索者的工作流程,并遵循同样的步骤来预测文档的相关性。这种方法不仅可以设计出高效的检索模型,还可以让模型有机会使用搜索者所使用的“行话”来解释其决策。在这次讲座中,将讨论我们最近在可解释检索模型方面的工作,这些模型能像医学工作者那样进行结构化的相关性判断。通过使用TREC精准医学文献搜索赛道(2017-2019)的数据,我们发现,一个简单可解释的模型也可以表现出与复杂黑盒模型一样的检索性能,并且仅需要很少的训练样本。这些结果表明,利用专业领域搜索中的结构化信息可以建立可解释的搜索工具,以支持专业搜索任务。同时,这也是一个有前景的研究方向。

报告人简介:王悦是北卡罗来纳大学教堂山分校信息与图书馆科学学院的助理教授,研究兴趣主要包括文本挖掘、机器学习、和信息检索。最近的工作重点是设计和评估交互式和可解释的机器学习算法,这些算法可以帮助科学家从大型非结构化文本中获得知识。在多个计算机和信息科学领域顶级会议发表文章,包括SIGIR、WSDM、CIKM、ACL、WWW、KDD、CHI、AMIA和JAMIA,是WSDM、SIGIR和WWW的程序委员会成员。曾获得2016年WSDM的最佳论文奖和2016、2019、2020以及2022年WSDM的杰出程序委员会成员奖。

报告时间:202245日(星期二)上午8:00--9:30

报告地点:腾讯会议 316-937-310