シンポジウム「ロボットは東大に入れるか」参加記録

本日開催された国立情報学研究所主催のシンポジウム「人工頭脳プロジェクト〜ロボットは東大に入れるか」(http://21robot.org/に参加してきました。いろいろと興味深いシンポジウムだったので以下(若干の抜け落ちもあり、他の参加者の方がいらっしゃいましたら訂正・コメントなどいただけると幸いです)記録です。また改めてコメントしたいと思いますが、まずは内容だけお届けできればと思います。


とその前に、あまりに長文になってしまったので私が考えるポイントを・・・


・5年以内にセンター試験高得点、10年以内に東大入試突破を目指したい。


・入学試験というものは、データベースの充実、記述されている日本語の簡潔明瞭さ、必ず解答が存在する、必要な要素技術に分割可能、といった点から見て、人工知能研究のグランドチャレンジとしてきわめて適切。


・本当に東大にロボットを入れようと思ったら、「試験中は電子機器を切らなければいけない」ので不可能。


・要素技術に細分化されてしまった人工知能研究を統合していくというところに意義がある。


・最大のハードルは、人間の「常識」。自然言語の意味を認識する上で必要な社会常識や経験が人工知能にはなく、人間が当たり前のように行っている言語処理が非常に難しい。


・研究の意義はいったいなんなのか?人工知能研究の未解決問題を適切に織り込めるのか?入試はどういうものか、どうあるべきかという点にまでインプリケーションを得ようとするのはお門違いであり、研究の意義は限定的なのではないか(以上安西先生の指摘)。




以下、時系列的にまとめましたので、時間のある方はがんばって読んでください笑。


最初は、坂内正夫所長による挨拶。


「物議をかもしたい。入試を突破できた場合、何を人間のスキルとして評価しているのかという問題になる。」とのコメントが印象に残りました。なお、東京大学にも「仁義を切って」始めたプロジェクトだそうで、これは将棋のときと同じですね笑。




続いて公立はこだて未来大学松原仁先生の基調講演。タイトルは「人工知能のグランドチャレンジ〜チェス、サッカー、クイズから東大入試へ」。チェス、将棋と数々の人工知能の挑戦に携わってきた松原先生が、人工知能による挑戦の歴史、そしてその中に今回のプロジェクトがどう位置づけられるのかを解説。


人工知能の研究自体は1950年頃から開始され、その成果の応用あるいは目標として「グランドチャレンジ*1が設定されてきたとのこと。最初のグランドチャレンジはチェスであり、探索手法の進展に大きく貢献したそうです。50年代にルール通りさせるようになったのを皮切りに、約50年の時を費やしての97年、IBMのDeep Blueが世界チャンピオンのカスパロフに勝利することに成功。なお、松原先生はその場に立ち会ったのだとか。


チェスに関して興味深いのは、当初のもくろみであった「見込みの高い少数手のみを読む」という人間の直感的な読みを模倣しようとしたがかなわず、全幅探索に手法を変えたところ功を奏したという点だったでしょうか。さらには、ハードウェア強化による飛躍的な能力上昇も背景としてあるとのこと。


他のゲームとしては、チェッカーが1993年世界チャンピオンに勝利、07年理論的に解析済み(引き分け)。オセロでは97年に世界チャンピオン破る。将棋、2010年に女流プロを破る(記憶に新しい清水市代プロ対あからの対決ですね)。囲碁モンテカルロ法の利用によりアマ4段程度の棋力あり、といったところだそうです。さらには松原先生ご自身がキックオフされたロボットのサッカーW杯「ロボカップhttp://www.robocup.or.jp/)」も行われており、2050年までにFIFAルールでW杯チャンピオンに勝つのが目標(!)だそうです。紹介されていたロボカップの試合映像は非常に微笑ましいもの(例えば→http://www.youtube.com/watch?v=oVJ9W_RetD8)でしたけれど…笑。


また今回のプロジェクトに近い対象としてはクイズがあり、ジョパディというアメリカの歴史あるクイズ番組への挑戦も紹介されていました。Deep Blueと同様、IBMによる「ワトソン」の開発が行われ、自然言語処理、自動検索、そして賭け金を決めるためのゲーム理論を導入して2011年に歴代チャンピオン2人に勝利することに成功したのだそうです(ただしネット接続は禁止)。


IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる

IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる


そして「ロボットは東大に入れるか?」という本プロジェクトに関しては、問題が比較的素直なので人工知能向きだと思うし、いつか本当のロボットが人間と一緒に受験してほしいとのことでした。成功の暁には「人工知能の進歩が目に見えて分かる」、「事務のある程度がコンピュータで代行できる」、「入試問題のむずかしさの基準が、受験生の質に関わらずわかる」、「東大入試の幻想がなくなる?(ロボットでも受かるじゃん)」などの帰結がもたらされるだろうという非常に夢のある結論でした。




次に、本プロジェクトを主導していらっしゃるNIIの新井紀子先生のプロジェクト概要説明。まずは多くの機関・企業から情報提供を得たことへの謝辞。赤本を片手にもっていらっしゃいました笑。やはり元になるデータベースがないと此の手のプロジェクトはどうしようもなくて、私自身「官庁訪問」のモデル化を試みた際苦労させられた記憶があります。


東京大学(理科?前期日程) (2012年版 大学入試シリーズ)

東京大学(理科?前期日程) (2012年版 大学入試シリーズ)



さて、本プロジェクト開始の発表後NIIには多くの質問が寄せられたようで、中には「ロボットが赤門を歩いてくぐって自分の席に着いて問題を解けるようになるんですか?」というものもあったとのこと、それに対して新井先生が「ロボットは東大には入れません。試験中は電子機器類の電源を全てOFFにしなければならないからです。」と答えて会場大爆笑。


新井先生は大学入試の人工知能開発においてなぜ適切な目標(グランドチャレンジ)となりうるかについて、


1. 前提となる知識源が明確(検定教科書の存在)
2. 筆記試験である(人と人とのインタラクションがない)
3. 試験問題が簡潔明瞭(誤読防止)に記述された、コントロールされた日本語である
4. 試験問題である以上、必ず正解がある
5. 客観的に比較可能
6. (必要となる要素技術への)分割可能性


などの要素をあげていらっしゃり、個人的には非常に興味深い背景でした。検定教科書があり、問題が大量に蓄積され、かつ誤読防止のために簡潔明瞭な言語で書かれているということは、日本に特有の環境であり、此の研究は日本でのみ可能であっただろうということでした。


また何故難しいのか?という理由については、人間の知能は「知識ー演繹ー常識」という三つの要素で構成されており、「常識」ー人間が当たり前にできること(例えば、問題の図表に「社会常識に照らして父親だと判断するのが合理的な男性を表象した絵」があったとき、それを素直に「父親」だと理解できること)が人工知能にとっては非常に難しいということを指摘しておられました。これは人工知能の研究に携わっていらっしゃる方々の中では最も大きな課題のひと綱用で、此の後講演された先生方も異口同音に「我々が当然だと思っている(あるいは当然だとすら思わないような当然なこと)」ことがAIについては大変なのだと強調されていました。


此のプロジェクトの意義として新井先生は、人工知能研究は目の前の問題に取り組みターゲットを絞り込んできた中で、その内部ですら様々な細分化・高度専門化(自然言語処理、画像処理等)が生じそれらが統合されていないという問題を指摘した上で、このようなrealisticかつfascinatingな問題を設定することでそれらの融合を図りたいとということを主張しておられました。


最後にプロジェクトの進め方として、幅広くオープンに参加を募り、プログラミングコンテスト等も行ってオールジャパンで行っていきたいと締めくくり。「社会的に合意している「優秀さ」はプログラミング可能か?」という問いを検証したいのだそうです。




新井先生の後は、NIIの稲邑哲也先生による「人工知能にとって東大入試はなぜチャレンジングか?」と題したお話。これまでの人工知能研究の反省点として「記号の情報処理だけでは不十分であり、曖昧である記号の意味・解釈を解決する必要」を指摘し、新しい潮流として身体性に根付いた情報処理を研究していきたいとのこと。


現状認識として、部分的なタスク(正確で高速な運動や制御、あるドメインでの人間との対話)に限定すれば成功はしているものの、古き良き人工知能が目標としていた問題には結局到達できていない。曖昧な実世界情報の解釈はある程度可能にはなっているが、高次レベルの知能の層と身体(センサー、アクチュエータ)の情報処理層を結ぶ橋がないとおっしゃっていたのですが、この辺りは門外漢としては中々実感しにくい所あがりました。


稲邑先生は「金属の定規にバターで豆をくっつけた、端をろうそくで暖めると豆はどういう順番で落ちるか?」(国際数学・理科教育動向調査2007)という問題を例に挙げ、直感化*2された知識を持つ小学生に人工知能は遠く及ばないこと、教科書の断片的な知識と経験の接合が人間の反応のポイントであると説明。その上で、実体験に基づく論理的思考というものを人工知能で実現することを目指すにあたって大学入試は最初のメルクマールになる、とその意義を強調されていました。


またこのプロジェクトは得点を取る機能をいたずらに追求する訳ではなく、実世界を理解する知性への挑戦であり、あえて人工知能に不利だと想定される物理や地学をターゲットにしていばらの道を歩むとの決意だということでした。


またご本人の研究テーマとしては、画像処理と自然言語処理の統合を目指しており、


・曖昧性解消のための画像理解と自然言語理解の相補的な統合
・ 図と文章からの物理モデルの再構成
・ 物理現象のモデル化と予測
・3次元モデルの構築と物理シミュレーションによる将来予測
・図と文章からの物理モデルの理解
・ 画像から得られる意味のグラフ化
自然言語から得られる意味のグラフ化
(特に最後の二つが興味深かった。図がないので説明しづらいのですが・・・)


といった目標をおいているのだそうです。




最後の演者はNIIの宮尾祐介先生。タイトルは「知識を問う問題にコンピュータはどれだけ答えられるか?」。ご自身の専門は自然言語処理で、言語入力と出力の間にどのような「計算」が行われているのかを明らかにするのが目的。今回のプロジェクトについては、大学入試は全ての科目・全ての問題が自然言語で出題されており、大学入試を突破するには自然言語処理が鍵であるとのこと。


知識を問う問題に大しては教科書や参考書を見れば答えられる問題であり人工知能が有利であるとしつつも、人工知能が得意なのは丸暗記であり暗記ではないという限界があり、人間が記憶しているのは言葉ではなく意味・知識なので、記憶していることと問われていることが意味的に一致しているかどうかを人工知能が認識するするのはきわめて難しいのだそうです。


上記の問題点をセンター試験世界史の問題を引用し、「イェニチェリ軍団」と「イェニチェリ」あるいは「皇帝直属の常備軍」と「オスマン帝国常備軍」は同じだとどう判断すればいい(自然言語処理の用語では「含意関係認識の有無」)のかを丁寧に解説。プロジェクトの第一歩としてNII主催の国際ワークショップで既にセンター試験へのチャレンジを行ってみたとのこと。


センター試験の問題とwikipediaからデータを作り、含意関係の有無で当否を判定したそうです。IBMカーネギーメロン大学、北陸先端科学技術大学、東京大学京都大学、NIIの6チームがそれぞれ3つづつモデルを出して競ったところ正答率は20%から60%の間で、最高はIBMの57.7%。含意関係の認識精度と正答率の相関係数は0.8であり、認識精度を上げれば正答率も上がることが見込まれるという結果を紹介していました。


既に知識を問う問題には5〜6割解答可能であり、えんぴつ(25%)よりはだいぶまし(笑)であるものの、抽象概念と具体的状況との整合性を認識する必要もあるし、東大入試の大半を占める論述問題を解くにあたっては関連知識の探索、出題意図の認識、回答方法の指定の認識が必要であるとその難しさを指摘しておられました。


言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)




休憩の後、「知性と知識のはざまで」と題して作家の瀬名秀明さんを司会に、安西祐一郎(日本学術振興会)、喜連川優(東京大学)、松原仁新井紀子の各氏でパネルディスカッション。知識とは何か?教育とは何か?人生に置ける入試の位置づけは?どういう技術的ブレイクスルーを伴い、どのように社会が変わるか?とまず瀬名さんが話題提起しました(今までも概説ですが、以下はさらにはしょってちゃんとメモできた要点のみ)。


知能の謎 認知発達ロボティクスの挑戦 (ブルーバックス)

知能の謎 認知発達ロボティクスの挑戦 (ブルーバックス)


喜連川先生は、基礎研究をunderstandableな形で伝える必要がある中で、「ロボットは東大に入れるか」というテーマは誰でもわかるゴール感があり、王道の基礎研究と外部環境をうまくつなげるものとして意義があるとおっしゃっていました。


瀬名:此のチャレンジの難易度は?
松原:わかるようならグランドチャレンジではない。6割をとらせるというときに、どういう要素技術に落とすかが問題。


瀬名:このようなプロジェクトを思いついたきっかけは?
新井:知的労働の代替をする人工知能、どの要素技術が代替するか?そういった研究を進める上で、東大入試はかなりいいところにあるハードル。要素技術間の先端知の非共有を是正し統合プロジェクトとしてやっていく。人工知能発展の先に人間はなにをするべきか?ということを考えていきたい、という趣旨。


瀬名:いつぐらいに突破できる?直感で(この問いに対し明確に答えたのは松原・新井両氏)
松原:できてしまうと、たいしたことないという声が上がる。特化するとかなりはやい(=予想・対策して6割を目標にするなら)。王道をいくと、10年程度かかる。
新井:いつまでかわからないといってやってはだめ。5年でセンター高得点、10年で受かるようにやる。時間を区切って遮二無二いくことで、要素技術が生まれる。若い力に期待。


瀬名:具体的な面白さは何処に出てくる?
新井:統合実権基盤をつくりAPIを公開、そこにモジュールとして接続するところ。細かい問題がいっぱいある。各研究室はひとつひとつやって来た。ただ、オープンな実験基盤の提供しても具体的な問題かつ分割可能じゃないと人は集まらない。
松原:このプロジェクトはオールジャパンということだが、ロボカップはいくつかのチームが競争して開発するという形で行われている。
安西:アルゴリズム化、データベース化するとなると、情報をどう表現するかが重要。でも手法は多様で死屍累々。同じ表現法を使わないと嵌る。


さらに新井先生と安西先生のやりとりとして以下のようなものがあったのですが、これはこのプロジェクトの科学的・技術的意義を考える上で非常に示唆的でした。


新井:人間はあまり経験をちゃんと処理してない?「だいたいこれだろう」というように鍵となる言葉を見て反応している。
安西:(学習に際して)なんども読み、何度も解くとキーワードだけピックアップできるようになる。アブストラクションの一種。そういうことについてどのくらい、プロジェクト担当者はわかっているのか?それはそもそも研究テーマなのか?


安西:研究としてやるとすると、大量の情報からいい情報を見つけ出すという意味はある。どういう情報を鍵にして見つけ出すかということ、記憶がどういう構造で格納されているか、どう学習されているのか、っていうのが大きなテーマ。そういう未解決のテーマを想定した上でやってるのか、単に面白そうだからやってるのか?
新井:これができなかったら先に進めない。これができないとその先もない。


また喜連川先生からのコメントとして、


喜連川:情報爆発プロジェクトには600人関わった。舵取りが難しい。EUを見てみると、各分野のトッププレイヤーを持ってきて共同研究をやっている。互いに100%つくす、それぞれの要素技術で100%を持ったプレイヤーが必要だ。
新井:有り難い方々に入っていただいている。これでできなければできない、位の印象。トップダウンも重要だが、(細分化し知の共有が進んでいない中で)実際につなげてみることがうまく行くことを結構実感している。今までつながっていなかったのだから、まずつながるべき。5年後にそれが見える。そこから本当に始まる。


終了前に京都産業大学の上田先生からの質問。


京産大・上田(質問):出題している人と話をしたのか?意図・背景を知り出題者が学生のどういう能力を測りたいのかを捉えた上でやらないといけないのでは?
新井:あくまでもベンチマーク、哲学的に入試がどうということではない。こういう現状についてそれを読み解くのが重要。
安西:はっきりした輪郭を持ったスクエアなものとしてやっていくなら意味がある。今までの研究結果としてやられていないことを提示してほしい。入試についてなにかインプリケーションをとなると、此のプロジェクトの目標はかなり限定されている。集まって!というのはモチベーションとしてはいい。
喜連川コンピュータサイエンスのグランドチャレンジとしては誰でも分かるし要素技術もいろいろ含まれるので意義はある。応援する。もし会場にいたら、京大でカンニング事件があったようにクラウドが可能な中、なんでそんな問題設定をするのかと尋ねる。


以上です。

*1:それ自体は直接役に立たずとも世の中で注目を集める象徴的な目標、技術的な進歩

*2:例えば人工知能がこれを解くとしたら、問題を自然言語処理で認識し、膨大なデータベースから重力方程式やバターが溶けるという特性や金属の熱伝導性といった情報を呼び出して結合して応用しないといけない