転移学習
てんいがくしゅう機械学習
意味・定義
あるタスクで学習した知識を別のタスクに応用する機械学習の手法。
解説
転移学習は、あるタスクで学習した知識を、別のタスクに転用する手法です。ゼロから学習するよりも、少ないデータと時間で高精度なモデルを構築できます。 転移学習の典型的な流れは、まず大規模なデータセットで事前学習します。例えば、ImageNetの100万枚の画像で画像認識モデルを学習します。次に、特定のタスク(例えば、医療画像の分類)に合わせて、モデルの一部をファインチューニングします。 転移学習が有効な理由は、低レベルの特徴(エッジ、色、形状)は多くのタスクで共通だからです。事前学習でこれらの特徴を獲得しておけば、新しいタスクでは高レベルの特徴(特定の物体や概念)だけを学習すればよいのです。 転移学習は、データが少ない分野で特に有効です。医療画像、希少言語の処理、特殊な製造業の品質検査など、大量のデータを集めるのが困難な場合に威力を発揮します。
使い方・例文
"医療画像診断では、ImageNetで事前学習されたResNetを、数千枚の医療画像でファインチューニングします。ゼロから学習する場合は数十万枚の画像が必要ですが、転移学習により数千枚で高精度なモデルが得られます。 自然言語処理では、BERTやGPTなどの事前学習済みモデルを、特定の業界(法律、医療、金融)の文書でファインチューニングします。専門用語や業界特有の表現を学習させることで、汎用モデルよりも高精度な処理が可能になります。"