畳み込みニューラルネットワーク
たたみこみにゅーらるねっとわーく画像認識
意味・定義
画像認識に特化したニューラルネットワークの一種。CNN(Convolutional Neural Network)とも呼ばれる。
解説
CNN(畳み込みニューラルネットワーク)は、画像認識に特化したニューラルネットワークです。人間の視覚野の仕組みにヒントを得て設計されました。 CNNの核心は「畳み込み層」です。小さなフィルター(カーネル)を画像全体にスライドさせて、局所的な特徴を抽出します。浅い層ではエッジや色の変化を検出し、深い層では目、鼻、顔といった複雑な特徴を認識します。 プーリング層は、特徴マップのサイズを縮小し、計算量を減らします。また、位置の微小なずれに対する頑健性も向上します。全結合層は、抽出された特徴を組み合わせて、最終的な分類を行います。 1998年のLeNet(手書き数字認識)から、2012年のAlexNet(ImageNet優勝)、2015年のResNet(152層の深いネットワーク)まで、CNNは画像認識の精度を飛躍的に向上させました。
使い方・例文
"顔認識システムでは、CNNが顔の特徴を抽出し、個人を識別します。スマートフォンのロック解除、空港のセキュリティチェック、SNSの自動タグ付けなどで使われています。 医療画像診断では、CNNがX線、CT、MRI画像から病変を検出します。肺がん、乳がん、網膜疾患などの早期発見に貢献しています。また、自動運転では、CNNがカメラ映像から歩行者、車両、道路標識を認識し、安全な運転を支援します。"