在Caffe 上实现了一个全神经网络的模型,训练了 3,000,000 步走法,达到43% 专业棋手下一手预测。
在Alpha Zero 出现之前,我们思考局势内在联系,未使用AlphoGo的价值网络与快速走子,仅靠全连接网络达到了一个不错的效果,同时可以自我对弈,这与Alpha Zero 的理念相通。
Github:
windows 64bit release 下载链接:
https://github.com/youkpan/caffe-windows-1/releases/tag/hayoouAIGO