第 28 回世界コンピュータ将棋選手権アピール文書

概要

「たこっと」は,電王戦を見てコンピュータ将棋に興味を持った筆者らが, フルスクラッチで実装した (している) 将棋プログラムです。 Web 上の解説記事や論文,Stockfish, Apery, やねうら王, Bonanza 6.0 のソースコードを参考にしています。

特徴

以前のたこっとから引き継いでいる特徴については過去のアピール文書を参照してください。

ライブラリの使用について

以下のライブラリの最新バージョンを使用申請しています。

ライブラリを提供していただき,Apery の平岡様,やねうら王の磯崎様,elmoの瀧澤様には感謝いたします。


学習ルーチン

以下に挙げるような近代的な機械学習の機能を一通り実装してあります。

第 5 回将棋電王トーナメントで elmo 方式の学習アルゴリズムを実装し,コンピュータ将棋界のトレンドにも追従しています。

評価関数に KPPT 型の三駒関係のモデルを採用していますが,近年は強化学習しても棋力の向上が微々たるものになってきました。 大量の学習データの作成と学習を何度も繰り返す必要がありますが,計算資源の確保に苦慮している貧乏プログラマーには厳しい限りです。 そこで学習で棋力向上が望めるような新たなモデルの開発に取り組むことにしました。

が...
今のところ結果がついてきません。

あまりに強くならない場合はライブラリの評価関数バイナリを強化学習し,大会に参加するかもしれません。