谁能击败申真谞--论围棋哲学的数学原理

棋闻趣事 2021-10-31 13:41:16 admin
2521


三星杯半决赛结束,中国选手不如愿地包揽了三四名。虽然船长预言成真,但一点也不对这个结果感到欣喜。中国围棋不能只靠柯洁,但如何制服申真谞呢?


在找到方法之前,我先推荐大家一个电影——点球成金


这是一部获得奥斯卡金像奖的影片,是由大牌明星布拉德皮特主演。剧情大意就是一支三流棒球队,在缺少资金没有大牌球员的情况下,另辟蹊径,利用一个耶鲁大学经济学硕士的学霸胖子的专业知识,借助各种大数据,利用统计学原理,协助球队屌丝逆袭咸鱼翻身获取冠军的励志故事。



学霸胖子彼得毫不留情地指出,球队的教练们错误地看待球员,错误的理解场上形势,他们靠的都是自己的感觉。但实际上,他们的所谓感觉、经验都是靠不住的,只有数字不会说谎。

目标不应该是买球员,而是买到胜利!


这说的只是棒球么?这跟围棋不是很像嘛?这跟如何利用AI一回事啊。这就是中国话所说的“他山之石,可以攻玉”。


AI只是一个工具,只是一个手段,而且并不是我们人类可以直接运用的。就好像短跑冠军没法儿借助迈巴赫发动机一个道理。因为人类跟AI的算力资源和反应速度是无法相提并论的,然而我们可以充分的利用这个工具啊。我们把这个棒球的思维转变成围棋:

目标不应该是学习手段,而是学习胜利!


我们再把这个话深入一步,所谓学习胜利,其实就是看穿胜率。


三星杯全军覆没撕下中国围棋的新装


其实在上篇文章中我就已经说了,对人工智能的学习,才是当今棋坛胜负的制高点。

那么学习人工智能是优先学习变化手段计算,还是优先学习判断和理论?我认为首先学习判断而不是手段,因为手段是千变万化的,每局都不同,而判断是自有其原理的。无论多少盘棋,他只是上升或下降两个趋势。很明显,这个才是棋盘上最容易找到的突破口!


那么如何研究判断呢?其实就是分析胜率,这就是核心。但对于胜率的百分数的表示方法我是有疑问的,因为这个并不反映现实。不妨做集中假设来具体分析一下:

一、战斗中的100%的胜率人类能否实现?

经常有这种局面,说胜率已经接近100%,但最后还是翻盘了,为啥呢?因为人工智能所运算的致命一击或者完美运行,可能人类根本达不到。那么在这种情况下,这个所谓的100%胜率毫无意义。

很显然,我们应该用一种数学的方法,对于这个100%加以修正,比如概率。在军事上有一个射击学的原理,就是说假如弹道覆盖目标基本上可以判定为命中,但这跟实际命中是有区别的,它有一个命中率,那么在围棋上能否也运用这个“命中率”的概念,根据手段的难易,给人类做一个重合的可能性判断,进行一个修正呢?也许这样更接近现实吧,得出的修正后的数字也更接近真相,更好理解。



二、半目胜负局面下100%胜率是否有意义?

这个局面之下,假设人类具有充足的时间及完美的判断和计算能力,当然是可以做到的。但往往这两个条件一个都不具备。假如领先半目的棋真的就没有逆转,没有波折的话,那么还有谁会怕石佛呢?可见,半目胜负的棋最终赢下来是一个有相当难度的事情。比如人类围棋以前经常说“10目天堑”,但少有人说“半目天堑”。

因此,我们对半目胜负局面之下的100%胜率也要重新认识。或者同样运用某些数学方法加以修正,不能真的把这种100%的胜率看做铁定胜利。


现在焦点集中在两点。

三、绝对优势的100%胜率是否具备可操作性?

假设开局某个变化吃了大亏,实地出现巨大差距,甚至死了一条大龙,那么理论上也有100%胜率了。但是这个对人类的围棋现实吗?比如李世石曾经在和孔杰的对局中死掉了一块80目的大龙,但最后竟然仍然翻盘胜利。这显然不能说是孔杰无能,而是领先的越早,翻盘的几率就越大,因为后面的路还很长,对手的机会多呀。想领先就不翻盘,人类棋手中即便石佛也不能做到。


而AI却能够一步领先,步步领先,那是因为他的算力资源几乎没有极限,从来不失误,没有情绪波动,集中力可以始终如一,也不受时间限制等多种因素影响。也就是说,这种大优局面的100%胜率是对AI而言,人类只有在传说中才能做到。

犹自忆玄宗


我们仍然借用军事术语来表达一下,假设每人都是神枪手,一颗子弹消灭一个敌人,中国抗战不需要打八年了。但事实不是每个人都是神枪手,百发百中只是一个美好愿望,只是一个成语。

同理,这种局面的100%胜率完全是强人所难。是否应该用数学方法加以修正?比如出现的越早,对手机会越多,我们就把这个比率下降一点,利用什么衰减指数甚至对数的形式加以修正呢?


四、这三种情况下的100%胜率有意义么?

这就是我提到的一个核心问题,在很多局面之下,这个胜率参考被人类奉为金科玉律,而实际上可能只是错误的理解了AI的表达而已。把一个只有机器能完成,而对于人类来讲惊险万分,甚至只能碰运气的独木桥当成了阳关大道。

这个尴尬局面的核心就在于我们没有正确的用数学方法去理解这个100%!

就像上面我说的,必须把不同局面的100%加以分类加以分析进行修正,用新的思路新的方法,比如运用回归、加权、区间、矩阵等各种数学方法做出模型,分头加以研究?从数学中找出一个答案。

非要用人类脆弱的计算能力,去复制人工智能那强大的无懈可击的完美冷酷的取胜之路,简直是难比登天,就像是骆驼穿针眼的魔术。



五、哪个胜率区间具有决定性的意义?

刚开始,一般认为50对50才是证明这个局部相当,后来又认为一方30一方60,也算可以。再往下认为70也不是决定性的。那么这个极值到了哪里,它会出现一个质变呢?是不是要通过大数据积累来解决,有没有简便的方法?

多普勒效应

二战中用高射炮去打飞机,炮弹在什么时候引爆这是一个关键问题。最早的方式是非常笨拙的,只能设定一个时间或者高度,但是还没打到的时候飞机就飞走了。

那怎么才能让他在最接近飞机的时候爆炸,达到杀伤力最大呢?于是,人们发明了无线电近炸引信,就是利用一个微型雷达,在飞机离他最近的时候起爆。但新的问题又来了,离远了爆炸没用,近到多少起爆效率最高呢?

这个时候,数学方法大展神威,利用了一种多普勒效应,就是假设这个阀值在目标从远到近的一刹那间达到一个顶点,然后急速衰退出现一个大转折。比如这个炮弹离飞机只有20米了,而下0.01秒钟变成了21米,那么说明这个时候是最近的时刻,起爆的效率最大。最终并没有用实际检测大数据等笨法子,而是利用这么一个聪明的数学方法解决了这个问题。


那么我们在对围棋战斗,棋局胜利的判断中,能否也能利用这个多普勒效应的理论,找出胜负转换的区间和极值呢?目前对此的判断比较肤浅,只会说胜率掉了多少点等等,未必找到胜负转换那一刹那的真谛,当然我也只是一种猜想。



假如我们完全从数学尚搞懂了不同局面胜率的含义,也许就掌握了学习人工智能的核心。就像点球成金那个电影中那样,要知道这本来并不是一个虚构的故事,而是有真实原型的。在对围棋AI学习和利用的过程之中,是否也能找到这样一种方法,把棋盘上搞不定的神秘莫测个毫无规律类似于玄学围棋问题,转化成清晰明确的有迹可循的数学模型呢?


船长有的时候沾沾自喜,自以为是不是只有我找到了这条路径。

当然,也许这只是我个人的妄想。但毕竟,谷歌之前也没人认为人工智能可以下围棋呀。

忍不住想起了牛顿,也许有朝一日,在对围棋AI的研究上,也能搞出一个《围棋哲学之数学原理》吧?


免责声明
本站内容均来源网络,并不代表本站观点,不对其真实合法性负责。如侵犯了您的权益,请附带网址告知,本站将立刻删除。9472089#qq.com (把#改成@)

相关文章