새소식

딥러닝/이미지 처리

VGGNet

  • -

VGGNet은 Backbone Network이다.

 

기존 네트워크들은 5X5 or 7X7 conv layer을 사용하는 경우가 많았다. 

→ layer를 거칠 때마다 feature map의 축소가 발생한다. (padding을 붙여주면 되겠지만 크게 붙여주어야함)

 

 

3X3 conv layer을 반복 사용하여 5X5나 7X7 layer를 대체가 가능하다.

  • 3X3 2번 == 5X5 1번  /  3X3 3번 == 7X7 1번 → 더 적은 파라미터(weight)으로 더 깊은 네트워크를 구성할 수 있다.
  • +1 padding을 활용하면 feature map의 크기 유지가 가능하다.

 

 

 

 

1. 3X3 Conv Layer + 1 padding

2. activation func

3. 2x2 maxpooling

 

  • 직관적으로 CNN 블럭을 여러개 쌓기 때문에 사용하기가 편리하다.
  • 마지막의 FC layer에서 파라미터가 많이 늘어난다는 단점이 있다.

 

 

728x90

'딥러닝 > 이미지 처리' 카테고리의 다른 글

Prototypcial Networks for Few-shot Learning  (0) 2023.06.22
DenseNet  (0) 2022.07.16
ResNet  (0) 2022.07.16
GoogLeNet  (0) 2022.07.16
AlexNet  (0) 2022.02.22
Contents