首页/术语词典/多模态 AI

AI 术语词典

多模态 AI

同时理解文本、图像等多种形式的 AI

定义

多模态 AI 是指能够在同一模型中处理和生成多种类型数据(文本、图像、音频、视频)的模型。GPT-4o 和 Gemini 1.5 是典型例子:你可以向它们展示图像并提问。多模态模型正在开启纯文本 AI 时代无法实现的新应用。

相关术语

相关工具

返回术语词典