English
日本語
忖度機Sontakki
このプロジェクトについてAbout this project
忖度機(そんたっき)とは、行間を読んで行動できる汎用人工知能を実現するための(現在の所unfundedな)プロジェクトです。
また、成果物となる(と期待される)汎用人工知能エージェントのことも指します。
片山晋(宮崎大学)がやっています。
Sontakki (Sontaku (=acting by reading between the lines) + ki (=machine)) is our (currently unfunded) research project
for creating general AI that can act by reading between the lines (and can hint others for desired consequences, if adequate).
It also means the (expected) resulting general AI algorithm.
This project is led by Susumu Katayama.
詳しくは、2019年12月の学生向けプレゼン>をご参照ください。
See my presentation for freshmen last December for details. (Sorry, it is available only in Japanese!)
忖度してくれる人がいないなら、機械に忖度してもらいましょう。
Let's Sontaku each other!
Hanabi: Game of Reading between the Lines忖度力発展ゲームHanabi
In this project, we use Hanabi for benchmarking, the card game that requires hinting others and reading between the lines in order to win.
本プロジェクトでは,忖度力が試されるカードゲームであるHanabiを当面のベンチマークとします.
At first, I planned to use DeepMind's Hanabi Learning Environment (HLE), but I implemented the game environment myself, because
もともとDeepMindのHanabi Learning Environment (HLE)を使おうかと思っていたのですが,
-
(私のアルゴリズムの初期段階では,Hanabiルールの学習は行わず,他のプレーヤの戦略のみ学習するので,)いずれにせよHanabi環境の実装は必要
anyway, I need to implement the Hanabi game environment, because (In the early stage of my project) my algorithm is not going to learn the rule of Hanabi but only the strategies of other players;
-
ルールが簡単なので結構簡単に実装できちゃった
the rule is so simple that its implementation was a piece of cake;
-
calling for open-source implementations (desirably in Haskell) of various strategies is advantageous in some ways; for example,
さまざまな戦略のオープンソースでの実装をHaskell推奨で募集することで,いろんなメリットがある.たとえば
-
他プレーヤーの戦略を学習する上で,それらをどのようなDSLのプログラムとして(どのような関数を組み合わせたプログラムとして)推定すればよいかが明らかになる
such implementations suggest how to design the DSL that models the other players' strategies as functional programs;
-
(異なる戦略,考え方にいかに寛容に対応できるか,という意味での)戦略の評価にも利用できる.
Safe Haskellを利用することで,明らかに安全なプログラムを簡単に判断して安全にオーバーヘッドなしに取り込んで評価できる
they can also be used for evaluating how generous (accepting different way of thinking) each strategy is;
thanks to Safe Haskell, obviously safe programs can easily be elected, embedded safely without any overhead, and evaluated.
てなわけでさっさと実装しちゃっています.
Hackage
Darcs Hub
ここから遊べます.
遊び方のビデオ(無音)
It can be played from here.
How to play (silent video)
今後の予定Plan
-
Substantiate this homepage and call for implementations of strategies
このホームページをもうちょっと充実させて,戦略の実装を募集
-
Define DSL (Domain Specific Language) for Hanabi strategies
Hanabi戦略のためのDSLを定義
-
Implement Hanabi agent that behaves optimally by estimating other players' algorithm, using MagicHaskeller
他のプレーヤーのアルゴリズムを推定して最適に振る舞うHanabiエージェントを(MagicHaskellerを使って)実装
-
Learn the DSL incrementally
DSLへのincremental学習の適用
-
(Maybe) apply the resulting algorithm to Japanese Mahjong
ついでに麻雀にも適用.(それが目的ではない.)