欧洲语言资源协会(ELRA)和国际计算语言学委员会(ICCL)将联合主办 2024 年计算语言学、语言资源和评估联合国际会议(LREC-COLING 2024),该会议将于 2024 年 5 月 20-25 日在意大利都灵举行。

此次联合会议将聚焦计算语言学、语音处理、多模态和自然语言处理领域的研究人员和从业者,重点关注评估和资源开发,以支持这些领域的工作。延续 COLING 和 LREC 的悠久传统,本次联合会议将突出重大挑战,提供口头报告和广泛的海报展示,为与会者提供充分交流的机会,并配以丰富的社交活动。

此次上海大学自然语言处理与人机交互实验室(H!NTLAB)由李唐同学主要参与的工作1篇论文被LREC-COLING 2024接收。 被录用论文的简要介绍如下: Towards Human-Like Machine Comprehension: Few-Shot Relational Learning in Visually-Rich Documents

类型: Long Paper

作者: 王昊 (讲师)、李唐 (2021级硕士研究生)等

简介: 键值关系在视觉丰富文档(VRD)中很普遍,通常在不同的空间区域中描述,并伴有特定的颜色和字体样式。这些非文本是重要的特征,极大地增强了人类对这种关系三元组的理解。然而,当前的文档AI方法无法考虑与视觉和空间特征相关的这些有价值的先验信息,导致性能次优,尤其是在处理有限的示例时。为了解决这一局限性,我们的研究重点是少样本关系学习,特别是针对VRD中键值关系三元组的提取。鉴于缺乏适用于该任务的数据集,我们引入了两个新的基于现有监督基准数据集的少样本基准。此外,我们提出了一种结合关系二维空间先验和原型校正技术的变分方法。这种方法旨在生成关系表示以类似于人类感知的方式意识到空间上下文和看不见的关系。实验结果证明了我们提出的方法的有效性,展示了其优于现有方法的能力。这项研究也为实际应用开辟了新的可能性。

图1
图1:具有多模态特征的视觉富文档少样本数据集
图2
图2:结合关系二维空间先验和原型校正技术的模型架构图
图3
图3:不同数据集不同方法的性能比较