Image-gathering & recognition (申し訳ありませんが，このページは2004年作成の古い内容のページです．近日中に最新研究成果と差し替える予定です．)

WWW からの自動画像収集と収集画像を用いた画像認識

WWWからの自動画像収集

　WWW(World-Wide Web)上には画像データが大量に存在しているが，WWWを画像データベースとして使うための手法は現状では確立していない．そこで，本研究では，ユーザが入力したキーワードに対応する画像を大量にWWWから自動的に収集するシステム Image Collector を実現する．

　Image Collector では，既存のテキスト検索エンジンを利用してキーワードに関係するwebページに多数アクセスし，そのHTML文書からキーワードとの関係の評価が高い画像のURLを抽出し，画像収集を行う．さらに，収集した画像をキーワード評価によって，A群，B群に分類し，評価の高いA群に対してはノイズ画像の除去を行い，それを一般の画像検索における質問画像であると見なして，B群およびA群で除去された画像から画像特徴に基づく類似画像の選択を行う．そして，A群, B群の両方からの選択画像を合わせて最終結果として出力する．実験では，最初にキーワードを与えるだけで，5分程度の処理時間で100枚以上の画像を収集することが出来る．

(クリックすると新しいwindowを開きます)

-->

WWW収集画像を用いた画像認識 (Web Image Mining)

　高速収集システムによって収集された画像を利用して，類似画像検索による画像認識を試みる．具体的には，数種類のキーワードに関する画像を収集し，それらを学習画像とテスト画像に分ける．そして，それぞれの画像から抽出した画像特徴量を比較することによって，テスト画像を学習画像の各クラスのうち最も類似しているクラスに分類することによって認識を行う．

　6種類の画像を合計1200枚収集し，そのうち120枚(各クラス20枚)をテスト画像，残りを学習画像として実験をした結果を次の表に示す．

　今度は，20種類合計5694枚収集し，そのうち400枚(各クラス20枚)をテスト画像，残りを学習画像として実験をした結果を次の表に示す．「ラーメン」「金閣寺」は，それぞれ，「どんぶりを真上から写した画像」，「池の反対側から撮った画像」という典型的な画像というのが存在するために認識率が5割を越えている．一方，「イチロー」は，人物の画像で，様々な洋服を着ていて，さまざな場所での画像が含まれているので，まったくうまく分類出来なかった．

　このことから，世の中の画像には，バリエーションが少なくて比較的簡単な方法で分類可能なクラスと，バリエーションがとても多くて分類が難しいクラスが存在することがわかる．後者の方は，画像とモデルのマッチングという単純な方法で解決不可能で，例えば「イチロー」の背番号５１が画像中に写っている場合，「マリナーズの５１番＝イチロー」という知識を利用することで認識が可能となる．このように，クラスによっては認識する対象物に関するあらゆる知識を統合して認識を行う必要がある．人間が普段何気なく行っている「認識」をコンピュータに行わせることは非常に困難なことである．

　人間の様に認識するには様々な知識が必要であるが，その知識をコンピュータにどうやって与えるかということは大きな問題である．これは従来の人工知能研究の最も大きな問題であり，これを解決するために膨大な情報が存在する WWWから有用な知識を自動獲得するというウェブマイニングの研究が最近注目を集めている．さらにウェブマイニングを容易にするために，Semantic Web が提案されている．ところがウェブマイニングの研究もSemantic Webもテキスト情報のみに注目して行われており，ライオンはどういう姿をしているか？とかエア─ズロックはどんな形の岩？などと言った画像による表現が適切な知識についてのWWWからの獲得の研究はほとんど行われていない．

　本研究では，分類クラスを表すキーワードに基づいてWWWから自動的に画像を収集し，それを用いて一般画像の自動分類を実現を目指している．これは WWWからの画像分類(認識)のための画像に関する知識の自動獲得，つまりウェブ画像マイニングという新しい研究の提案であり，現在困難とされている一般画像に対する自動認識の実現のための新しいアプローチである．

YANAI Lab.

WWW からの自動画像収集と収集画像を用いた画像認識