コンピュータビジョン

こんぴゅーたびじょん

画像認識

意味・定義

コンピュータに視覚的な情報を理解・処理させるAI技術の分野。画像や動画から意味のある情報を抽出する。

解説

コンピュータビジョンは、コンピュータに人間の視覚能力を持たせる技術分野です。画像や動画から情報を抽出し、理解します。コンピュータビジョンの主要タスクには、画像認識（物体の識別）、物体検出（物体の位置特定）、セグメンテーション（領域分割）、姿勢推定（人体の姿勢認識）、3D再構成（2D画像から3Dモデル生成）などがあります。コンピュータビジョンは、畳み込みニューラルネットワーク（CNN）、Transformer、拡散モデルなど、様々なディープラーニング技術を使います。また、カメラ、LiDAR、レーダーなどのセンサーと組み合わせて、より正確な認識を実現します。コンピュータビジョンは、自動運転、ロボット工学、医療画像診断、拡張現実（AR）、監視システム、製造業の品質検査など、幅広い分野で応用されています。

使い方・例文

"自動運転車は、コンピュータビジョンでカメラ映像を解析し、道路、車線、歩行者、車両、信号機を認識します。複数のカメラとセンサーを組み合わせて、360度の周囲環境を把握し、安全な運転を実現します。製造業では、コンピュータビジョンが製品の外観検査を自動化します。カメラで製品を撮影し、傷、汚れ、欠陥を検出します。人間の目では見逃しやすい微小な欠陥も発見でき、品質が向上します。また、スポーツでは、選手の動きを解析し、フォームの改善やパフォーマンス向上に役立てます。"

コンピュータビジョン

意味・定義

解説

使い方・例文

関連語

関連記事

畳み込みニューラルネットワーク

画像認識

物体検出

セマンティックセグメンテーション