クイズ王に勝利したIBMのWatsonの秘密

IBMのWatsonの記事が少し前に話題になっていた。

IBMリサーチの4年間にわたる研究成果である質問応答(QA)システム「Watson(以下ワトソン)」が、米国の人気クイズ番組「Jeopardy!」(以下「ジョパディ!」)に挑戦し、2ゲームを通じて、ワトソンが最高金額を獲得しました。

人工知能の文脈で解説されているが、世間一般では(配信された内容と思われるが、)

Watsonは、1997年にチェスのグランドマスター、ガルリ・カスパロフ(Garry Kasparov)氏から最終的に勝利を奪ったスーパーコンピューター『Deep Blue』の後継機と言える

そうだ。また、以下のところがこの本質的なポイントのようだが、

100万冊分の本に相当する内容を取り込み、質問に含まれる微妙な意味、風刺や謎掛けなどの複雑な要素の分析をしなければなりません。本来、人間とは異なり、自然言語を正確に理解することのできないコンピューターにとっては大きな挑戦...

記事だけから読み取るのは想像になるが、人の質問に対してその内容を理解しそれらしく何かを答えられたらそれは素晴らしいことだと思う。実際、クイズの場面では、出題者は持って回った言い方をし、引っかけ問題などもあるだろうから、その内容を本当に理解することができれば今後の応用の可能性は非常に高く有意義に思う。
ただ、本当のところは記事だけからは解らない。こういう問題に対するアプローチとして極端に分けると、①人の認識能力をめざし「意味理解」に正面から取り組む場合と、②「クイズ」への対応として問題文の中のキーワード(複数)から関連する解答を見つけ出すことに特化する場合が考えられる。(①②ともそれぞれ色々なレベルが有るが。今回①②の間のどこに軸足が有るのか、日本人独特の視点かもしれないが気になる。)
②の場合でも、人名を聞かれているのか、施設の有る都市名か、物事の前後関係か、関連するできごと・作品.. 等、について文章の構成から読み取る必要が有る場合、なかなか難しい。少なくとも尋ねられているのが名詞の場合、名前なのか、場所なのか、時間関係か.. 等を読み取らなければない。例えば「日本人はなぜ長寿命なのか?」という質問で、「日本人」が「長寿命」な「理由」を読み取る場面も出てくるだろう。
今のGoogleを始めとする検索技術は進んでいるので、その「理由」を答えるレベルまで行っているかもしれない。「理由」を見つけ出す方法とか。
AI-COM も基本は検索なので似たようなロジック。ただ、動機付け・感情や意味理解などのアプローチに特に注目している。

記事中にはあまり詳しい内容記載は無いが、一件Watsonが失敗した問題について記載が有る。

アメリカの都市」というカテゴリーで「その都市の最大の空港は第二次大戦の英雄の名前を付けられている。2番目に大きい空港は第二次大戦の戦いの名前を付けられている」というもの。正解はオヘア空港(エース・パイロット、エドワード・オヘアにちなんで)とミッドウェー空港(ミッドウェー海戦にちなんで)のある「シカゴ」だった。ところがWatsonは「トロント????」と答えた。

やはり関連するキーワードから「都市」を導き出す問題のようだ。以下は何故失敗したかの解説:

While searching through data, it notices that the United States is often called America. Toronto is a North American city. Its baseball team, the Blue Jays, plays in the American League. (That's why Ferrucci was wearing a Blue Jay jacket). If Watson happened to study the itinerary of my The Numerati book tour, it included a host of American cities, from Philadelphia and Pittsburgh, to Seattle, San Francisco, and Toronto. In documents like that, people often don't stop to note for inquiring computers that Toronto actually shouldn't be placed in the group.
(Google翻訳)データを探している間は、通知、米国はしばしばアメリカと呼ばれていることを確認します。 トロントは、北米の都市です。 その野球チームは、ブルージェイズアメリカンリーグで演じています。 (つまり、フェルッチはブルージェイジャケットを着ていたのだ)。 ワトソンは私Numerati本ツアーの日程を検討するが起こった場合には、シアトル、サンフランシスコ、トロントフィラデルフィアピッツバーグから、アメリカの都市のホストを、含まれています。 そのような文書では、人々はしばしば、トロントは、実際にグループに配置しないことをコンピュータを調べるのに注意して停止しないでください。

Google翻訳は思ったより解りにくいが、不足ぎみの情報量の中で、米国では「北米」の都市の範疇であるトロントを米国の都市として「検索」したということだろう。試しに上記引用問題(アメリカの都市で、その都市の最大の空港は・・・)をググッたら何か出るかと思って試したら、IBM Watson関連の記事がたくさん出たww。