AI对世足赛结果的预测

  • 作者:
  • 时间:2020-06-06
AI對世足賽結果的預測


撰写本文之际,世足赛已进入八强赛。许多众人看好的队伍,却出乎意料地在此之前早已淘汰。其中最令人震惊的,莫过于世足赛史上战绩辉煌的德国队,竟未能进入十六强。尤其与南韩一役,没人能料到昔日的冠军队伍却沦为丧家之犬。有趣的是,早在本次世足赛前,已经有多个人工智慧,以不同方法对十六强赛到总冠军赛的结果做出了预测,其中不乏四个月前曾精準预测奥斯卡奖得主的人工智慧。预测结果仅供参考,但背后的原理与演算法,或可作为往后AI发展的借镜。

运用集体智慧的Swarm AI

Swarm A.I.是由美国公司Unanimous A.I.所开发,曾经正确预测时代杂誌的年度人物、奥斯卡奖得主,与一场超级盃赛事比数,可说战功彪炳。Swarm A.I.字面上翻译为「群体人工智慧」。其基本概念,来自动物界的集体智慧(collective intelligence)现象。在蚂蚁、蜜蜂、鸟类等群体动物中,即使每个个体都没有足够能力做出複杂决策,然而通过合作与分工达成複杂任务,使得整个群体看似一个拥有单一思维、高度智慧的个体。

Swarm A.I.也是一个仰赖群体做出决策的系统。当Swarm A.I.要对一系列事件进行预测时,其后团队会负责找到该领域的专业人士,例如在预测超级盃时,共谘询40位资深球迷。在参酌每人意见后,经由特定演算法整合出一份最终预测结果。

本次世足赛预测,则与英国公司Colossus合作,由该公司提供足球领域的几位专家,再经由演算法整合每个专家的意见,形成一个「大脑们的大脑(a brain of brains)」。预测重点如下:德国将击败巴西卫冕世足赛冠军;西班牙和法国将在季军赛交锋并获胜;上届亚军阿根廷本次将无缘四强。

当然,这并不是一个纯粹由机器做出的预测。是否可视为人工智慧?恐怕仍存在争议。

新随机森林演算法

由德国、比利时等地的跨国团队开发的人工智慧,则参酌了三种传统常用模型:蒲瓦松回归(Poisson Regression)、随机森林(Random Forest)与排序法(Ranking Method),仔细评估各自预测表现与使用时机,最终提出了一套新的混合演算法。

随机森林是近年相当热门的机器学习演算法。其中「森林」,是指它运用多个决策树;「随机」则是每个决策树选择的是不同的变数集合。一般的决策树模型是利用统计资料,透过评估资料中各项变数对结果的影响,进而生成一个分类器,用以计算任一结果的实现机率。

然而,由统计数据训练出来的模型都存在一大缺陷─过适问题。也就是机器所预测的结果「太像是过去的统计数据」,而失去预测新事件的能力。新的随机森林正是为了解决过适问题而诞生,藉由产生多棵决策树,并选择资料中不同的变数集合,各自做出预测。最后,统计不同决策树的预测结果,计算出特定情境的发生机率。因为有多棵树的参与,排除了过适与偏见的产生。

排序法则参酌如FIFA、各家博弈公司对各队伍的排序数据,以推断各队实力。将排序法产生的数据加入随机森林模型,以最佳化人工智慧的预测效力。

经过十万次模拟后,结果显示:巴西夺冠希望最高;德国则以2%机率紧追在后。另外,如果单看队伍胜率不考虑赛程(因对战组合也会影响排名),则以西班牙胜率最高。

预测结果

很不幸地,两个人工智慧都没有太好的表现,毕竟德国与冠军早已无缘。不过,由Swarm A.I. 所预测的分组积分赛结果,在几个组别上完美吻合,十六强也中了十三强。随机森林算法预测的结果,十六强更是中了十五强。

投资管理公司Golden Sachs的A.I.亦对世足赛做出预测:决赛将由巴西对上德国,而巴西有望夺冠,地主队俄罗斯则将在分组阶段淘汰。单看队伍胜率,法国队则高居第二。然而,它们除了一样没能料到德国提前出局,对于俄罗斯的预测也是差强人意:俄罗斯在睽违数十年后,重新进入八强。

世上少有如运动竞技如此迷人之物。即使到了未来,科技与社会的大幅变化似乎改变不了群众那份随之沸腾的一腔热血。7月15日的决赛将决定本届世足赛冠军。本文介绍的两组AI,都有了各自的预测:分别是德国队与巴西队。至于结果如何,就交由读者你来验证了!

参考资料