一方面是Stockfish8。这个世界冠军计划像炸药一样处理棋子,以巨大的力量-每秒产生6000万次潜在动作。在这数百万个动作中,Stockfish选出了最好的动作-“最佳”动作是由计算机科学家和国际象棋大师共同设计的复杂,手动调整的算法定义的。该算法重视典当位置及其国王安全性等因素之间的微妙平衡。
另一方面是一个名为AlphaZero的新程序(“零”意味着循环中没有任何人类知识),这是一种象棋引擎,在某种程度上比Stockfish弱得多,其每秒移动速度仅为对手的1/100 。但是AlphaZero是完全不同的机器。它没有通过外部专家设计的算法来推断“最佳”动作,而是通过一种称为机器学习的人工智能技术自行学习策略。它的程序员只是用国际象棋的基本规则对其进行了调整,并允许它自己对战几百万场比赛。据了解,AlphaZero逐渐制定了自己的策略。
头对头的战斗是惊人的。在100场比赛中,AlphaZero从未输过。AI引擎凭借令人眼花sacrifice乱的牺牲,冒险的举动和漂亮的风格赢得了比赛(赢得了28场比赛,其余比赛都吸引了其他人),这是计算机国际象棋世界中全新的风格。
英国国际象棋大师Matthew Sadler和数学家以及国际象棋大师Natasha Regan仍在他们的新书Game Changer中拼凑出AlphaZero的策略是如何工作的。我们仅在其中一款游戏中就打破了两招,以展示出侵略性的风格,表现以及人类可以从我们的新国际象棋冠军那里学到什么。