华人团队爆火InstructBLIP抢跑看图聊天,开源项目横扫多项SOTA

近日,华人团队开源了多模态基础模型InstructBLIP,是从BLIP2模型微调而来的模型。InstructBLIP模型更擅长「看」、「推理」和「说」,即能够对复杂图像进行理解、推理、描述,还支持多轮对话等。最重要的是,InstructBLIP在多个任务上实现了最先进的性能,甚至在图片解释和推理上表现优于GPT4。(腾讯新闻)

THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容