コンピュータビジョン
こんぴゅーたびじょん画像認識
意味・定義
コンピュータに視覚的な情報を理解・処理させるAI技術の分野。画像や動画から意味のある情報を抽出する。
解説
コンピュータビジョンは、コンピュータに人間の視覚能力を持たせる技術分野です。画像や動画から情報を抽出し、理解します。 コンピュータビジョンの主要タスクには、画像認識(物体の識別)、物体検出(物体の位置特定)、セグメンテーション(領域分割)、姿勢推定(人体の姿勢認識)、3D再構成(2D画像から3Dモデル生成)などがあります。 コンピュータビジョンは、畳み込みニューラルネットワーク(CNN)、Transformer、拡散モデルなど、様々なディープラーニング技術を使います。また、カメラ、LiDAR、レーダーなどのセンサーと組み合わせて、より正確な認識を実現します。 コンピュータビジョンは、自動運転、ロボット工学、医療画像診断、拡張現実(AR)、監視システム、製造業の品質検査など、幅広い分野で応用されています。
使い方・例文
"自動運転車は、コンピュータビジョンでカメラ映像を解析し、道路、車線、歩行者、車両、信号機を認識します。複数のカメラとセンサーを組み合わせて、360度の周囲環境を把握し、安全な運転を実現します。 製造業では、コンピュータビジョンが製品の外観検査を自動化します。カメラで製品を撮影し、傷、汚れ、欠陥を検出します。人間の目では見逃しやすい微小な欠陥も発見でき、品質が向上します。また、スポーツでは、選手の動きを解析し、フォームの改善やパフォーマンス向上に役立てます。"