Table of Contents

728x90

3x3 컨볼루션 커널을 사용하는 것은 컨볼루션 신경망(CNN) 설계에서 매우 일반적인 선택입니다. 이 크기는 계산 효율성, 성능, 그리고 네트워크 깊이의 균형을 잘 맞추는 데 유리하기 때문에 널리 사용됩니다. 아래에서는 3x3 컨볼루션 커널의 사용 이유를 몇 가지 관점에서 설명합니다:

1. 효율적인 정보 처리

3x3 컨볼루션은 이미지의 지역적 특징을 효과적으로 추출할 수 있는 충분한 크기를 제공합니다. 1x1 커널은 주변 정보를 고려하지 않고, 5x5 이상의 큰 커널은 불필요하게 많은 정보를 처리하며 매개변수 수가 급격히 증가합니다. 반면, 3x3 커널은 주변 픽셀과의 관계를 효과적으로 포착하면서도 매개변수의 수를 상대적으로 적게 유지합니다.

2. 매개변수와 계산 효율성

3x3 컨볼루션은 5x5 컨볼루션과 비교했을 때 매개변수의 수가 적습니다. 예를 들어, 두 개의 3x3 컨볼루션 층을 연속적으로 사용하는 경우 총 매개변수는 (3x3x2 = 18) 개가 되는 반면, 한 개의 5x5 컨볼루션 층은 (5x5 = 25) 개의 매개변수를 가집니다. 더 적은 매개변수로 유사한 효과를 낼 수 있기 때문에, 더 적은 계산 비용으로 네트워크를 효율적으로 학습할 수 있습니다.

3. 네트워크 깊이와 복잡한 특징 학습

3x3 컨볼루션을 여러 층에 걸쳐 쌓는 것은 네트워크의 깊이를 늘리면서 각 레이어의 복잡도를 적절히 제어할 수 있게 합니다. 네트워크가 깊어질수록 추상화 수준이 높은 특징을 학습할 수 있으며, 이는 이미지 분류, 객체 탐지 등 다양한 고급 비전 태스크에 유리합니다.

4. 레셉티브 필드 확장

3x3 컨볼루션을 연속해서 사용하면, 각 레이어를 지날 때마다 레셉티브 필드가 점진적으로 확장됩니다. 이는 모델이 더 넓은 영역의 정보를 포착하게 하며, 전체적인 이미지 컨텍스트를 더 잘 이해할 수 있게 합니다.

이러한 이유들로, 3x3 컨볼루션 커널은 CNN 아키텍처에서 가장 일반적으로 사용되는 커널 크기 중 하나입니다. 이 크기는 효율성과 성능 사이에 최적의 균형을 제공하며, VGGNet, ResNet 등 많은 유명한 네트워크 디자인에서 중요한 역할을 합니다.

'DeepLearning' 카테고리의 다른 글

Gradient vanishing  (0) 2024.07.29
Receptive Field  (0) 2024.07.29
MLP --> CNN --> Transformer  (0) 2024.07.29
torch 모델 구조 graph로 그리기  (0) 2024.07.26
torch 모델 출력하기, torchinfo  (0) 2024.07.25