ResNet: 深層学習の壁を突破する革新的なネットワーク構造
- ResNetとはResNetはResidual Networkの略称で、画像認識をはじめとする深層学習の分野に大きな進歩をもたらしたネットワーク構造です。従来の畳み込みニューラルネットワーク(CNN)では、ネットワークの層を深く積み重ねるほど、勾配消失問題という課題が発生することが知られていました。これは、誤差逆伝播 során、勾配がネットワークの浅い層に届くまでに徐々に小さくなってしまい、学習がうまく進まなくなるという問題です。ResNetはこの勾配消失問題を解決するために、残差ブロックと呼ばれる画期的な構造を導入しました。残差ブロックでは、入力データを複数の畳み込み層と活性化関数に通す経路(ショートカット接続)が設けられています。このショートカット接続によって、入力データがそのまま出力側へ伝わるため、勾配が消失することなく、深い層まで伝播するようになります。ResNetの登場により、非常に深いネットワークであっても効率的に学習が可能となり、画像認識の精度が飛躍的に向上しました。ResNetはその後、物体検出やセグメンテーションなど、様々なタスクに適用され、深層学習の発展に大きく貢献しています。