随着人们对听障人士与常人之间高效交流方法的不断探索,基于深度学习的连续视频手语识别技术作为非常可行的方案,受到了广泛关注。,针对手语视频模态数据与复杂语言语义难以对齐的问题,IM电竞 IM电竞网址通过挖掘手语语言序列中的先验知识,IM电竞 IM电竞网址跨模态融合手语视频信息与手语语言知识,IM电竞 IM电竞平台有效提升了连续手语视频的表征学习能力。针对连续视频手语识别任务训练时损失函数条件独立的问题,提出了上下文感知的序列转导损失函数,创新地开发了一种条件依赖的连续视频手语识别训练方法。
在跨模态视频表征学习过程中,利用预训练的语言模型提取手语标注语言序列的先验知识,构建语言特征。IM电竞 IM电竞平台通过循环多模态上下文融合方法将语言特征与视频特征进行深度结合。文章提出的上下文感知的序列转导损失函数,有效利用已预测序列上下文来指导下一步序列的生成,使得识别过程更加符合实际场景。实验结果表明,这项工作提供了一个有效的基于跨模态上下文序列转导的连续手语识别方法,大幅提升了连续视频手语识别的性能,同时也为手语识别的其他研究工作提供了新的思路。
地址:马鞍山经济技术开发区湖东南路555号众一创意街区4栋201-202
电话:15955552931
邮箱:admin@masydzp.com