Research Introduction: Towards Human-Level Artificial Intelligence 研究紹介:人間レベルの人工知能の実現に向けて

Susumu Katayama 片山 晋

December, 2019 2019年12月9日

Organization of this presentation目次

Organization of this presentation目次

汎用知能

俺アプローチ

大人レベルの汎用人工知能
効率無視で最大限に汎用的な人工知能
スキルをどんどん学習(インクリメンタル学習)
((プログラム/行動(behavior)を)探索 =
広く浅く探索 + 有望なところを掘り下げる)

Organization of this presentation目次

AIXI: An "Ideal" General AI (Reinforcement Learning) Agent AIXI: "理想的"汎用人工知能(強化学習)エージェント

`ideal' means... "理想的"とは...
  • expected to be universal 万能性が期待される
  • it is not computable.... 計算不能....
考え方:
環境(外界)を(Turing機械の)プログラムと考えて推定し,ベストの行動をとる!
しくみ:
  1. 経験と矛盾しないプログラムの無限リストを保持
  2. 各プログラムを確率で重み付けし,自分の取る各決定の価値(利得の期待値)を計算
  3. 一番いい決定を選択

AIXIの残念な所

  1. 計算不能
  2. 他者との関係をモデル化できない。
    環境=プログラム(計算可能)  →  環境中にAIXIが存在できない!

Unlimited Computable AI (UCAI):
"The" Computable AIXI variant AIXIの計算可能な改変

UCAI (Katayama, 2019, JAGI): アルゴリズム:(AIXIと同じ)
  1. 経験と矛盾しないプログラムの無限リストを保持
  2. 各プログラムを確率で重み付けし,
    自分の取る各決定の価値(利得の期待値)を計算
  3. 一番いい決定を選択

Unlimited Computable AI (UCAI):
"The" Computable AIXI variant AIXIの計算可能な改変

UCAI (Katayama, 2019, JAGI): アルゴリズム:(AIXIと同じ)
  1. 経験と矛盾しないプログラムの無限リストを保持
    • ここが大変! でも、
    • 既に実装したものがある!
  2. 各プログラムを確率で重み付けし,
    自分の取る各決定の価値(利得の期待値)を計算
  3. 一番いい決定を選択

MagicHaskellerによる実装

MagicHaskeller: Inductive functional programming system / library based on generate-and-test MagicHaskeller:
生成テスト法による, 曖昧な仕様からの自動プログラミングシステム/ライブラリ
(AIXIとは独立に開発)

MagicHaskellerの実装

it just enumerates all valid programs and then tests against the spec. ライブラリ(予め定めた集合)にあるプリミティブを組み合わせて作れる、
型にあったプログラムを全て列挙して、仕様に合致しているかテスト

MagicHaskellerの特徴

Organization of this presentation目次

Incremental Learning インクリメンタル学習とは

既に学習した結果を利用して、学習を深化

Example: learning to calculate 例: 計算を学習
Learning to calculate

Learning Programs/Behaviors Incrementally プログラム/行動のインクリメンタル学習

Incremental learning cycle インクリメンタル学習のサイクル

skill = expression in the library (= primitive) スキル = (その時々のライブラリにある)プリミティブ

Instincts and learned skills 本能と獲得スキル

Instincts and Learned Skills 本能,獲得スキル

When talking about incremental learning of programs/behaviors, プログラム/行動のインクリメンタル学習に関して
inctinct本能
expression in the initial library (set of primitives) 最初のライブラリにある式
learned skill 獲得スキル
expression not in the initial library but in the current library 最初のライブラリにはないが現在のライブラリにある式
Instincts and learned skills

複雑な仕組み(知覚関係とか、深層学習が得意な処理を含め)を本能として組み込める!

Organization of this presentation目次

General AI Challenge

世界初の汎用人工知能のコンテストに参加しました.

Objective of the ChallengeChallenge第1回の目的

To build an agent that ようなエージェントを作ること
(First Round Specification)

要はインクリメンタル学習!

Environment環境

Just see....

経緯

オフィシャルな日程:
Announcement & start アナウンス & 開始
Feb. 15, 2017 2017年2月15日
Deadline 締め切り
Aug. 14, 2017 2017年8月14日(半年後)
Results announcement 結果発表
Sep. 30, 2017 2017年9月30日

General AI Challengeについて思うこと

Organization of this presentation目次

Hanabi: The card game of reading between the lines気配りのカードゲームHanabi

Hanabi: 阿吽の呼吸で協力し合いながらせっせと花火を打ち上げるゲーム
Hanabi @ Board Game Arena (BGA)

Why Hanabi matters?Hanabiのここがすごい!

Let's Sontaku気くばりは日本人のこころ

気くばりのすすめ (1982年)
文部科学省への気配り
○蔵省(現在の財務省・金融庁)官僚が○ー○゜○しゃぶしゃぶによる接待を要求 (1998年)
(伏字は行間を読んでください)
『そろそろどうかね』『その話は夜聞こう』 → 「飲食店」での勉強会
企業での気くばり
「仕事がきつくて死にそうだけど、迷惑がかかるからやめられない」
戦時中の気くばり
特攻兵は全員志願兵
(C.f. ◎大アメフト部監督「クォーターバックを潰してこい」
→ 「思いっきりプレーして欲しいという意味だった」(2018年))
籠池氏「直接ではなかったが忖度があったと思う」(2017年)
忖度: 意向を推し量って行動すること.気くばり.

How to make a Sontak-ki忖度する機械(忖度機)の作り方

忖度:他人の思考回路・アルゴリズムを推定して最適に行動

俺アルゴリズムで普通に可能!
むしろ深層学習とかだけでやろうとすると無理(多分)

「忖度機」と命名

Concluding Remarks最後に

片山(晋)研究室(忖度研究室)への配属を考えている人がやっておくこと