输入内容以搜索工具。使用上下方向键在联想项之间移动,回车执行搜索,Tab 打开高亮项,Escape 关闭面板。
AI 术语词典
使 AI 目标与人类价值观一致
AI 对齐是确保 AI 系统追求与人类价值观和意图一致目标的挑战。未对齐的 AI 可能在字面上实现了目标,却违反了人类意图。对齐研究包括 RLHF、宪法 AI 和可解释性等技术,是 Anthropic 和 OpenAI 等注重安全的 AI 实验室的重点研究方向。