推荐视频:
https://www.bilibili.com/video/BV1H441177fc
https://www.bilibili.com/video/BV1UJ411L71G
高手实战:
https://www.bilibili.com/video/BV1Ah411Z79w
黑棋不让白模仿,直接往天元一走,就破了。
白棋不让黑模仿,绕着天元走就破了。
围棋AI是如何完美破解模仿棋的?
柯洁说,“看到了AlphaGo破解模仿棋的,真厉害!”。这引发了不少人的兴趣,想知道AlphaGo是如何破的,但柯洁没有提供细节。最近一个叫BensonDarr的新AI,可能演示了这种完美破解。
围棋的模仿棋,在职业棋手对局中并不罕见,日本九段藤泽库之助就喜欢下模仿棋。柯洁对AlphaGo三番棋中,也出现了柯洁是否应该下模仿棋的讨论。哈萨比斯说AlphaGo应该能对付模仿棋。而柯洁最终也没有下模仿棋。
围棋模仿棋分为执黑模仿,和执白模仿。拿黑棋先下的人就下天元,然后模仿对方。但是在现代的分先对局中,黑方有贴目,一直模仿下去黑棋一定会因为贴目而输掉。实际不需要破解就不成立。
这是周俊勋执黑对Master,黑1下天元,然后一直模仿到69手。但是此时黑1这个子效率低下,并不成功。黑71变招,很快就不行了。
现在说对AI的模仿棋,一般都是人类棋手执白模仿AI。
例如柯洁曾经对绝艺14连败,后来发微博说终于用模仿棋终结了连败,就如上图。这时的绝艺不会对付模仿棋,AI也普遍拿模仿棋没办法。
执白模仿的原理是,对方的招就算再厉害,我复制就有同等价值,如果能维持到局面缩小,7目半或者6目半的优势就足以让白方获胜了。
而人类高手,已经总结了几种破模仿棋的办法。一种是做出征子,双方都征,在中央碰头,先下的就能获胜了。一种是在中间下棋,子贴着子走,如果对方模仿就会互相包围,最后自己先提。下图是日本动漫画《棋魂》中的局面,塔矢亮就是用这个办法破解了业余对手的模仿。
但是对AI来说,要实现这种比较复杂的办法,难于编码,也比较困难。因此从DeepZenGo开始,AI们普遍用了一种简单的处理办法:执白被模仿不用管,如果执黑前10手发现对手模仿,就在第11手占天元!
上图是CGI执黑对柯洁。柯洁又用模仿棋对付AI,CGI到第11手的时候发现被模仿,就不顾一切占了天元,这样对手就没法模仿了。
这个办法对付一般对手是可以的,没法模仿以后,对手只能拿出真本事,于是实力差距就出来了。但是,黑棋不管局面如何,第11手强占天元,基本是一手低效的棋,可能丢失了先行优势。如上局,柯洁就评价说,黑天元是败招,后面下成下图黑大败。
因此,黑棋第11手(或者更多手后)强占天元,不是一种好的破解方法。虽然对手没法模仿了,但也达到了“减少黑棋先行优势”的战略目的,黑棋并不是完美破解。
上图的“符合预期”是绝艺模仿Master做的升级版本,非常厉害,对人类棋手一直不败。柯洁又拿出模仿棋来对付它,符合预期也是第11手占天元破模仿棋。此局后面几手甚至出现了AI反过来模仿柯洁的搞笑局面。本局柯洁最终获胜,是人类棋手对它的唯一胜局。绝艺升级版甚至能让顶尖高手二子,却显得不会破模仿棋。
从AlphaGo Zero公布的行棋和训练原理看,它追求自然提升,一切以胜率为导向,不要人类干预。其实人们可以推出,完美的AI不会象下面这样破解模仿棋:
1. 不是早棋占天元这种破解,这既不自然,占天元也会降低胜率,不是优美的办法。AI用这种办法破解,人类棋力有差距还是会输,但不会是让柯洁说“真厉害”的完美破解。
2. 早早到中间行棋营造对杀局面也不自然。如果到中间行棋会降低胜率,AI不会考虑这种下法。
3. 制造征子也不太自然,AI随机选择差不多的分支选项,不会有意导向征子。
每步都追求胜率的AI应该用一种自然的办法破解模仿棋:
1. AI执黑下的每一步都是提高自己的胜率,不会降低本方胜率。
2. 对手脱离模仿,不能提高自己的胜率(否则AI等于前面下得不好,让对手取得了优势)。对手只有继续模仿维持一定的胜率。
3. 棋越下越多,AI的黑棋胜率越来越高,对手白棋却没有办法,越陷越深。
4. 这时棋会发展到中间,黑白棋块终于碰上了,而黑棋可以先下天元,在杀气中取得胜利,白棋胜率会剧降到接近0。
5. 于是白棋只好强行脱离模仿,接受胜率大降的现实。
上面的过程才是理论上AI对模仿棋的完美破解,非常自然,黑方胜率一直提高,对手根本无机可乘。既没法从脱离模仿中受益,也会在后期的中间对杀中堕入深渊。面对这样的AI,对手执白只有早早脱离模仿,模仿越多越吃亏。这才是“完美破解”的意思。
野狐围棋平台上的BensonDarr就数次展示了这种破解。BensonDarr很可能是IT大公司用大量GPU资源模仿AlphaGo Zero训练的AI。
如上图,BensonDarr面对模仿就一着着地下,并不急于占天元。对手一直模仿到了140手,找不到脱离模仿的时机。这时黑141冲,如果白也在对称位置冲,那黑白中间两块对杀,最后结果显然会是黑棋在天元下子,提掉白棋,获得大胜。白棋只有终止模仿,可是141的关键位置被占气太紧,怎么走都不好了,没几手就败下阵来。
如图,双方模仿至87手(左下角和右上角小有区别不是关键)。但是白不敢在87的对称位模仿了,否则黑占天元,白下的这个子就成了送死,或者成为孤棋被攻得很惨。
如图,BensonDarr又慢慢将棋块发展到中央。如果白棋继续占对称点,则黑先冲断后占天元,黑的子连接良好,而白子却会被分开,下成下图这样。
如果下成这样,黑6终于占天元,就会发现,白1没有出路了,黑与1对称的子却连成一团没有事。而且白上面到中间的大块很危险,黑对称的这块却没有问题。
因此,柯洁看到了AlphaGo对模仿棋的完美破解,可能就是这样的:白棋发现胜率越来越低,却没法脱离模仿,直到陷入深渊
坂田荣男是怎样破白模仿棋的
模仿棋不是这么简单能破解的,因为你的对手随时可能停止模仿。
现在一般黑棋是不会为了下模仿棋而第一手天元的,因为要贴目,第一手下天元,实地损失太大。但是题主的条件是没有先手贴目,这时候黑棋第一手天元并且下模仿棋也是可以理解的,并且在实战中也有人应用过。在吴清源执黑对木谷实的一盘棋中,吴就曾第一手天元并且开始模仿棋。在60多手后黑棋主动停止了模仿,但最后还是白棋获得了胜利。关于这局棋,“弈备子”在他的网易博客上有精彩的讲解,但是太长了,就不贴过来了。链接:吴vs木谷第一局天元模仿棋
而关于白棋的模仿棋,直接走天元肯定不是好的破解方法。比如双方前四手各自站角,而你发现对面开始模仿你,第五手走天元,这时候对面可以不理会你,直接挂角或者拆边,占领大场。这样你损失了几十目,只得到了一个天元,一般来讲肯定大亏。
职业棋手很多人都下过模仿棋,尤其是藤泽朋斋,非常喜欢下模仿棋。这里讲一下藤泽朋斋,他是日本棋院的第一位九段,并且是唯一一位在十番棋中战胜吴清源的人(虽然是吴清源让先)。这样的高手,也喜欢下模仿棋,说明模仿棋还是有其存在的合理性的
关于白棋模仿棋的破解,这里给出一个棋谱,黑棋是坂田荣男,白棋是藤泽朋斋,来自日本第14期名人战,我们来看看剃刀坂田是如何破解模仿棋的
前24手,白棋完全模仿黑棋。而这时的黑棋第25手,果断点在天元,一下子让黑棋形成模样,而让白棋左边三子成为孤棋,可谓此时的消长点。
非常有意思的是,在第25手天元之后,黑棋反过来模仿白棋,而在这一过程中,天元的黑棋始终扮演着非常重要的角色:
直到白棋第82手在G7点飞出,黑棋才停止模仿,第83手围住上方大空。这盘棋最后黑棋顺利取胜,坂田荣男“以彼之道,还施彼身”,可谓是一场完胜。总结起来,对于白棋的模仿棋,黑棋不能慌而急于站天元从而给白棋占其他大场的机会,而是安心布局。当天元这个店成为当前最重要的大场或者急所的时候,就要果断下在天元,从而使对面不仅不能继续模仿,还在局面中落了下风。
我是ikatago作者兼傻逼!请不要跟我计较。