首页/术语词典/训练数据

AI 术语词典

训练数据

塑造 AI 模型的文本和示例

定义

训练数据是用于训练 AI 模型的大量文本、图像或其他数据的集合。对于 LLM,这包括书籍、网站、代码、科学论文等——通常是数万亿个 token。训练数据的质量、多样性和时效性严重影响模型的能力和偏差。训练数据有知识截止日期——模型对截止日期之后发生的事情一无所知。

相关术语

返回术语词典