AI在赛车游戏中击败人类 |
神经网络驱动程序的表现优于人类玩家。Wurman等报告了一种名为GTSophy的神经网络算法,该算法能够击败电子游戏GT赛车中最优秀的人类玩家。当两个人类玩家试图阻塞两辆GTSophy汽车的首选路径时,算法找到了两种超越方法。图片来源:Nature
美国马萨诸塞州波士顿索尼通信公司的Peter Wurman和合作者在一项报告中表示,一种人工智能(AI)在对战赛车游戏Gran Turismo(GT赛车)中战胜了世界冠军级玩家。这个智能体在遵守赛车规则的同时展现出了超凡的行驶速度、操控能力和驾驶策略。研究结果 2月10日发表于《自然》。这对自主导航以及基础AI研究具有应用价值。
AI的许多潜在应用都需要一边与人类交互一边在物理系统中做出实时决策,而赛车正是这类情况的典型代表。赛车手必须进行复杂的战术性操控去超越或阻挡对手,同时还要以极限牵引力来驾驶赛车。以PlayStation的游戏《GT赛车》为代表的拟真类赛车游戏不仅能再现操控真实赛车的挑战,也对机器学习的应用提出了挑战。
在研究中,Wurman和合作者让一个名为“GT Sophy”的AI智能体学会利用深度强化学习来玩《GT赛车》。他们训练这个智能体掌握在赛车比赛中高效加速和刹车的艺术,并学习如何在不同情况下或在对手挡路时替换行驶路线。
想要训练出一个成功的AI,最大的挑战之一是要确保它不会因为触犯赛车规则而受罚,这里的赛车规则是一组由外部人类裁判判决的宽松规则。最后,GT Sophy利用代表不同赛车挑战的三组赛车与路线组合——包括时速超过300千米的赛车——在对战比赛中成功击败了四位全球顶级电子竞技赛车手。
以上结果是计算机战胜最强人类对手的一项最新竞技任务,其他竞技任务还包括国际象棋和扑克。作者认为,研究结果或让赛车游戏变得更有意思,并能提供用来训练职业赛车手和发现新赛车技巧的高水平比赛。这种方法还有望应用在真实世界的系统中,比如机器人、无人机和自动驾驶汽车。
相关论文信息:
https://www.nature.com/articles/s41586-021-04357-7
神经网络驱动程序的表现优于人类玩家。Wurman等报告了一种名为GTSophy的神经网络算法,该算法能够击败电子游戏GT赛车中最优秀的人类玩家。当两个人类玩家试图阻塞两辆GTSophy汽车的首选路径时,算法找到了两种超越方法。图片来源:Nature
美国马萨诸塞州波士顿索尼通信公司的Peter Wurman和合作者在一项报告中表示,一种人工智能(AI)在对战赛车游戏Gran Turismo(GT赛车)中战胜了世界冠军级玩家。这个智能体在遵守赛车规则的同时展现出了超凡的行驶速度、操控能力和驾驶策略。研究结果 2月10日发表于《自然》。这对自主导航以及基础AI研究具有应用价值。
AI的许多潜在应用都需要一边与人类交互一边在物理系统中做出实时决策,而赛车正是这类情况的典型代表。赛车手必须进行复杂的战术性操控去超越或阻挡对手,同时还要以极限牵引力来驾驶赛车。以PlayStation的游戏《GT赛车》为代表的拟真类赛车游戏不仅能再现操控真实赛车的挑战,也对机器学习的应用提出了挑战。
在研究中,Wurman和合作者让一个名为“GT Sophy”的AI智能体学会利用深度强化学习来玩《GT赛车》。他们训练这个智能体掌握在赛车比赛中高效加速和刹车的艺术,并学习如何在不同情况下或在对手挡路时替换行驶路线。
想要训练出一个成功的AI,最大的挑战之一是要确保它不会因为触犯赛车规则而受罚,这里的赛车规则是一组由外部人类裁判判决的宽松规则。最后,GT Sophy利用代表不同赛车挑战的三组赛车与路线组合——包括时速超过300千米的赛车——在对战比赛中成功击败了四位全球顶级电子竞技赛车手。
以上结果是计算机战胜最强人类对手的一项最新竞技任务,其他竞技任务还包括国际象棋和扑克。作者认为,研究结果或让赛车游戏变得更有意思,并能提供用来训练职业赛车手和发现新赛车技巧的高水平比赛。这种方法还有望应用在真实世界的系统中,比如机器人、无人机和自动驾驶汽车。
相关论文信息:
https://www.nature.com/articles/s41586-021-04357-7
热门