AI 术语词典

宪法 AI

通过规则训练 AI 有用、无害且诚实

定义

宪法 AI(CAI)是 Anthropic 开发的一种对齐技术,使用一套原则("宪法")在训练过程中指导 AI 的自我评估。模型不完全依赖人类反馈,而是根据这些原则批判自己的输出并修改。CAI 是使 Claude 行为更一致、更安全的技术之一。

相关术语

相关工具

返回术语词典