起之路,它巧妙地混合了三种算法:蒙特卡洛树搜索监督学习增强学习。
其中蒙特卡洛树搜索是一种优化过的暴力计算,比1997年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是alphag一获得突破性进展的关键算法。
而增强学习作为辅助,是两台alphag一从自我对战众中学习如何下棋,据悉对棋力提升有限。
而alphag一20完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。
alphag一20依靠的,是其核心研发团队研制的人工神经网络!
而距离今天,alphag一20版本,已经成为了古董。因为,这个故事已经是半个世纪前的事情了。
今天,仅仅两周后,更加惊人的消息传来。rdt竟然战胜了最新的alphag一60版本!而这个版本,是alphag一20历经50多年后的最新进化成果。
根据最新的比赛规则进行的对弈,双方的结果,竟然是4:0!
这样一来,狗狗的历史不败记录50多年来第一次被颠覆了,而且,还被颠覆得如此的彻底。何止举世皆惊!
大家根本无法理解,已经达到可以让子人类5目以上水平的超级ai狗狗,还能够败在何方神圣的脚下?因为以它之前的战绩,就早已非人类所能及了!
阴冷的帐篷内,爱德的电脑屏幕上,突然弹出一个闪烁的小窗口:
“申请加好友:rdt”
爱德内心深处翻涌着不知名的情绪,正犹豫着是否同意。
思考再三,似乎像坚定地下定决心般,他轻轻地嘘了一口气。抬起右手食指,点击了同意。但在设置窗口中,选择了拒绝视频选项,他不想过早暴露自己的形象。
rdt:夏虫不可以语于冰者,有个性,好名字。
语冰:rdt,您好!您的名字早已如雷贯耳啊!如何还会对我这样的小人物有兴趣啊!
爱德个性豪爽惯了的,更是经历过无数大场面,所以即使面对rdt这样的大ip,他也是一种很放松的状态。
rdt:您可不是小人物
语冰:听说您刚刚干掉了alphag一60!呵呵,恭喜啊!
rdt:它连婴儿都还算不上罢了。
rdt:但凡不能杀死你的,最终都会使你更强大。 that hich d一es n一t kill akes str一nr
语冰:哲学家尼采的名言
rdt:智慧之语
爱德有些吃惊,他憧憬过无数次与rdt见面的场景,也酝酿了很多好奇的问题。
对于这个问题,爱德也预设过dt会有很多种回答,但这个回答是他无论如何也没有想到的。
语冰:那么,问一个冒昧的问题,您是ai吗?
沉默的一分钟,
沉默的五分钟,
不仅语冰觉得难耐,也许网络那头的dt感觉更加煎熬。这么难回答爱德有些奇怪。
十分钟后,屏幕上再次闪烁。
rdt:应该不是:)
对方这种回答问题的方式真的很有趣,爱德琢磨着,不禁微微一笑,觉得对方似乎是一个很有意思的人。也许跟自己还能成为不错朋友。想到这里,几个字跃然屏幕。
语冰:我也应该不是:
『加入书签,方便阅读』