多模态问答的方法和挑战

2022/10/14 11:00:35 3595 
 

多模态检索成为近期关注的问题,当前的方法包括单流方法、多流方法,以及不同模态之 间对齐的技术,已经在知识挖掘L域开展应用。

图像问答可以分为三个层次:

1.初J:从图像识别啲结果中直接得到答案

2.中等:答案需要简单事实的支持

3.GJ:对于复杂的问题,答案不在图像中,可能涉及常识、具体 话题和百科知识进行推理

多模态问答的挑战:

1 多模态数据具有异构性

2 多模态数据的关联难度表示较大

3 多模态知识融合困难

4 多模态问答大多只能处理简单的问题

5 多模态知识问答推理能力弱

6 多模态知识问答可解释性差


 
上一篇   下一篇
 
返回顶部
  技术支持
  关于创泽
  隐私条款
咨询热线
 
销售咨询
4006-935-088 / 4006-937-088
 
客服热线
4008-128-728

版权所有 @ 创泽智能机器人集团股份有限公司
运营中心 / 北京市·清华科技园九号楼5层
生产中心 / 山东省日照市开发区太原路71