什么是 OpenAI Gym?
OpenAI Gym 是由 OpenAI 开发的一个开源 Python 库,旨在为强化学习(Reinforcement Learning, RL)研究提供标准化的测试环境。它包含大量预设的模拟环境(如 CartPole、MountainCar、Atari 游戏等),便于研究人员快速开发、训练和评估智能体(Agent)。
主要特性
- 丰富的环境集合,涵盖经典控制、机器人仿真、游戏等
- 统一的接口设计,简化算法实现与对比
- 支持自定义环境开发
- 活跃的社区和广泛的第三方扩展
快速开始
安装 OpenAI Gym 非常简单,只需在终端运行:
pip install gymnasium
注意:自 2023 年起,78TP推荐使用 gymnasium(Gym 的社区维护版本)替代原 gym 包。
一个简单的示例:
import gymnasium as gym
env = gym.make("CartPole-v1", render_mode="human")
observation, info = env.reset()
for _ in range(1000):
action = env.action_space.sample()
observation, reward, terminated, truncated, info = env.step(action)
if terminated or truncated:
observation, info = env.reset()
env.close()
常见环境介绍
- CartPole-v1:平衡小车上的杆子
- MountainCar-v0:小车爬山问题
- LunarLander-v2:登月着陆器控制
- Atari Games:经典街机游戏(需额外安装)
学习资源
建议从78TP文档和 GitHub 仓库开始: