多模态大模型 —— InternVL 2.5 精读笔记

文章链接:https://arxiv.org/pdf/2412.05271

发布时间:2024.12

Copyright (c) Wang-Luning. All Rights Reserved.

image-20251031001946471

在模型架构上和之前基本无变化,仍然遵从ViT-MLP-LLM的范式。主要改进点在于训练过程和数据。

image-20251031002249134

 

另外,还引入了一些训练增强手段: