画像認識

がぞうにんしき
画像認識

意味・定義

画像に写っている物体や人物、シーンなどを識別・分類するAI技術。

解説

画像認識は、AIが画像の内容を理解し、物体や人物、シーンを識別する技術です。人間の視覚を模倣し、写真や動画から情報を抽出します。 画像認識の基本タスクは、分類(画像全体が何を表すか)、検出(画像内のどこに何があるか)、セグメンテーション(ピクセル単位でどの部分が何か)です。畳み込みニューラルネットワーク(CNN)が、画像認識の主要技術です。 画像認識の精度は、2012年のAlexNetの登場以降、飛躍的に向上しました。ImageNetコンペティションでは、AIが人間の認識精度を超えました。現在は、数千種類の物体を高精度で識別できます。 画像認識は、顔認識、医療画像診断、自動運転、製造業の品質検査、農業の作物監視など、様々な分野で応用されています。

使い方・例文

  • "スマートフォンの写真アプリは、画像認識で写真を自動分類します。「犬」「ビーチ」「誕生日」などのキーワードで検索でき、数千枚の写真から目的の写真を瞬時に見つけられます。 医療では、画像認識がCT画像から肺がんを検出します。放射線科医と同等かそれ以上の精度で、早期発見に貢献しています。また、製造業では、製品の表面を撮影し、傷や欠陥を自動検出します。人間の目では見逃しやすい微小な欠陥も発見できます。"

関連語

CNN物体検出セグメンテーション

関連記事