画像認識

がぞうにんしき

画像認識

意味・定義

画像に写っている物体や人物、シーンなどを識別・分類するAI技術。

解説

画像認識は、AIが画像の内容を理解し、物体や人物、シーンを識別する技術です。人間の視覚を模倣し、写真や動画から情報を抽出します。画像認識の基本タスクは、分類（画像全体が何を表すか）、検出（画像内のどこに何があるか）、セグメンテーション（ピクセル単位でどの部分が何か）です。畳み込みニューラルネットワーク（CNN）が、画像認識の主要技術です。画像認識の精度は、2012年のAlexNetの登場以降、飛躍的に向上しました。ImageNetコンペティションでは、AIが人間の認識精度を超えました。現在は、数千種類の物体を高精度で識別できます。画像認識は、顔認識、医療画像診断、自動運転、製造業の品質検査、農業の作物監視など、様々な分野で応用されています。

使い方・例文

"スマートフォンの写真アプリは、画像認識で写真を自動分類します。「犬」「ビーチ」「誕生日」などのキーワードで検索でき、数千枚の写真から目的の写真を瞬時に見つけられます。医療では、画像認識がCT画像から肺がんを検出します。放射線科医と同等かそれ以上の精度で、早期発見に貢献しています。また、製造業では、製品の表面を撮影し、傷や欠陥を自動検出します。人間の目では見逃しやすい微小な欠陥も発見できます。"

画像認識

意味・定義

解説

使い方・例文

関連語

関連記事

畳み込みニューラルネットワーク

物体検出

セマンティックセグメンテーション

コンピュータビジョン