5 月 23 日至 27 日谷歌人工智能将与柯洁九段在乌镇围棋峰会对弈
wujiai
|柯洁在发布会现场。本文图片均由澎湃新闻记者张宁拍摄
届时,他除了与目前世界排名第一的柯洁进行三局比赛外,还将参加峰会安排的人机配对和团体赛。
根据谷歌中国给出的比赛时间,柯洁与王雪燕将在5月23日、25日、27日进行三场比赛,双方每人比赛时间为3小时,有5个一分钟倒计时。
5月26日举行的人机配对赛中,顾立与连笑两人将互相对战,但每位选手都会有一位队友轮流与其出招,真正体现了一起学**的真谛。
在5月24日举行的团体赛中,我国五位世界冠军石樾、芈昱廷、汤韦星、陈耀晔、周睿羊将组队进行团队对决,建立棋手“神经网络”,减少心理因素的影响,共同考验面对组合风格时展现出的创造力和应变能力。
柯洁威胁:坚持信念,一定赢
发布会上,谷歌大中华区总裁施孟表示:“我们一定要把带到中国,中国是围棋的发源地,有很多优秀的棋手。谷歌CEO和联合创始人都非常支持把带到中国,这将让人们思考围棋的未来走向何方,人工智能又将走向何方。峰会期间,我们还将举办人工智能论坛,共同探讨AI技术。”
由柯洁率领的人类棋手代表团将于5月与对决。
本届比赛棋队领队柯洁在发布会上表达了自己的决心:“一定要打败!”
“很多走法和绝妙的思路给我们带来了很多启发和享受。半年前我就知道这个消息,能和对弈是我的荣幸,能代表人类对弈是不可想象的,我会尽全力去赢。”柯洁说:“这个团队是一支非常了不起的团队,会对我们棋手产生非常长远的影响,能给人类的未来带来奇妙的变化。我站在历史变革的节点上,我不会轻易妥协,不会说人机一起赢,我会有必胜的心态,有一定要赢的信念,一定要打败!”
2016年3月,他以4比1的总比分战胜韩国棋手李世石,引起轰动。赛后,韩国棋院还授予他九段荣誉证书。当时,柯洁曾“宣称”愿意与他对弈。
如何训练?
近日,升级版游戏以“/”为名与世界顶级围棋选手进行了60盘快棋对弈,全部获胜,此次升级为下个月的“较量”增添了悬念。
谷歌表示,为应对围棋巨大的复杂性,采用了一种新颖的机器学**技术,该技术融合了监督学**和强化学**的优点。通过训练柯洁将战阿尔法狗,形成一个策略网络( ),该网络以棋盘上的情况作为输入信息,为所有可行位置生成概率分布。然后,训练一个价值网络( value )来预测自我对局,以-1(对手绝对胜利)到1(绝对成功)的标准预测所有可行位置的结果。这两个网络本身都非常强大,将这两个网络集成到基于概率的蒙特卡洛树搜索( MCTS )中才能发挥其真正的优势。最后,新版本生成大量自我对局棋局,为下一代版本提供训练数据,这个过程不断重复。
集成强大的战略网络()和价值网络(价值)。
在获得棋局信息后,策略网络会探索哪些位置既有高潜在价值,又有高概率,进而确定棋子的最佳放置位置。在分配的搜索时间结束时,系统在模拟过程中检查次数最多的位置将成为最终选择。在经过最初的全面探索和过程中对最佳走法的不断推测后,搜索算法可以在其计算能力中添加类似人类的直觉判断。
它会基于策略网络,探索哪个位置既有较高的潜在价值,又有较高的概率,然后决定放置棋子的最佳位置。








