物体検出

ぶったいけんしゅつ
画像認識

意味・定義

画像内の物体の位置と種類を同時に検出するAI技術。

解説

物体検出は、画像や動画の中から特定の物体を見つけ出し、その位置と種類を特定する技術です。画像認識の一種ですが、「何があるか」だけでなく「どこにあるか」も判定します。 物体検出は、2つのタスクを同時に行います。分類(その物体が何か)と位置特定(その物体がどこにあるか)です。出力は、物体を囲む矩形(バウンディングボックス)と、その物体のクラスラベル(例:「犬」「車」)です。 代表的なアルゴリズムには、YOLO(You Only Look Once)、SSD(Single Shot Detector)、Faster R-CNNなどがあります。YOLOは高速で、リアルタイム処理に適しています。Faster R-CNNは精度が高く、複雑なシーンでも正確に検出できます。 自動運転、監視カメラ、ロボット工学、医療画像診断など、様々な分野で応用されています。

使い方・例文

  • "自動運転車では、物体検出がカメラ映像から歩行者、車両、道路標識、信号機を検出します。各物体の位置と動きを追跡することで、安全な運転判断を行います。例えば、歩行者が道路に飛び出しそうな場合、即座にブレーキをかけます。 小売店では、物体検出が商品棚の在庫を自動監視します。カメラが棚を撮影し、どの商品が何個あるかを検出します。在庫が少なくなると、自動で補充指示を出します。また、医療では、X線画像から腫瘍や骨折を検出し、医師の診断を支援します。"

関連語

画像認識YOLOFaster R-CNN

関連記事