输入内容以搜索工具。使用上下方向键在联想项之间移动,回车执行搜索,Tab 打开高亮项,Escape 关闭面板。
AI 术语词典
AI 如何学会有用且安全
RLHF 是用于使语言模型与人类偏好对齐的训练技术。人工评分员比较模型输出并排名,这些排名用于训练奖励模型,奖励模型再通过强化学习指导进一步微调。RLHF 是 ChatGPT 和 Claude 比原始预训练模型更自然、更安全的关键原因。