AI对齐共1篇
RLHF强化学习-介绍及使用场景 | 星尘资源网

RLHF强化学习-介绍及使用场景

1. 引言强化学习(Reinforcement Learning, RL) 是一种让智能体(Agent)通过与环境交互学习最优策略的机器学习方法。
站长的头像 | 星尘资源网站长18天前
0279