视觉语言模型# 指南 多模态输入 纯文本 单张图像 多张图像 单个视频 多个视频 图像与视频混合 时序数据 本地文件与 Base64 处理器与 IO 参数 示例 DeepSeek-VL2 简介 快速开始 LLaVA 安装 离线推理 在线服务 InternVL 安装 离线推理 在线服务 InternLM-XComposer-2.5 简介 快速开始 Lora 模型 量化 更多使用例子 cogvlm 简介 快速开始 MiniCPM-V 安装 离线推理 在线服务 Phi-3 Vision 简介 安装 离线推理 pipeline 在线服务 Qwen2-VL 安装 离线推理 在线服务 Qwen2.5-VL 安装 离线推理 Qwen2-VL 安装 离线推理 在线服务 Gemma3 简介 快速开始