2024年5月11日,哈尔滨工业大学计算学部语言技术研究中心机器智能与翻译实验室博士生马婷婷顺利通过博士学位论文答辩。
马婷婷同学师从赵铁军教授,博士期间在ACL、NAACL、TASLP等高水平国际会议与期刊上发表了多篇学术论文,获得国家奖学金。
马婷婷同学的博士论文题目为《面向语言理解复杂场景的少样本分类技术研究》,该论文主要面向自然语言理解中跨语言、跨类别、跨任务的多种复杂数据稀缺场景下的少样本分类技术展开研究。在跨语言场景下,提出了协作标签去噪框架的少样本学习方法,提升了分类模型在跨语言少样本下的泛化能力;在跨类别场景下,提出了基于分解元学习框架的少样本学习方法,提升了分类模型在多个序列标注任务上的少样本泛化能力;在跨任务场景下,分别讨论了基于文本蕴含模型和预训练句子表示模型的方案,借助预训练模型的能力提升分类模型的跨任务少样本学习效果。上述研究成果为提升分类模型在多个自然语言理解任务上的少样本泛化能力做出了贡献。