もふもふ技術部

IT技術系mofmofメディア

othello

強化学習(Q-Learning)で学習させたオセロAIで、MinMaxアルゴリズムと戦わせる

前回4x4のオセロで最強のAIを作ろうとしたらランダムさんごときにボッコボコされたところからの続きです。 強化学習(Q-Learning)でオセロAIを学習させてみた Q学習 vs ナイーブ Q学習 vs ランダム Q学習(バトルモード) vs 竜王ミニマックス おまけ: Q学習(バ…

強化学習(Q-Learning)でオセロAIを学習させてみた

年2回、毎度楽しみにしている「開発合宿友の会」の開発合宿に来ております。やはりコード書くのはこの上ない幸せですね。 というわけで、前回強化学習(Q-Learning)で四目並べを学習させてみたというのをやってうまくいかなかったので、別のゲームで実装し直…