SegNet
논문 저자는 도로를 달리면서 촬영한 영상(Road Scene)의 Semantic Segmentation을 수행하기 위해 모델은 조금 더 class에 대해 빠르고 정확하게 구분해야 한다고 말합니다. 이를 논문 저자는 다음과 같은 Architecture로 해결하였습니다.
Architecture
크게 Encoder와 Decoder로 나뉘는데 Encoder는 VGG16에서 FC Layer를 제외한 13개의 Layer를 사용하였고, Decoder는 Encoder를 뒤집은 구조로 볼 수 있습니다.
DeConvNet 중간의 Conv, Deconv 를 제거하고 Deconvolution 대신 Convolution을 사용하였고, FC Layer를 제거하여 파라미터 수를 크게 줄였으며, 이로 인해 메모리의 효율성을 높였습니다.
참고
'Paper Review' 카테고리의 다른 글
[MobileNet] Efficient Convolutional Neural Networks for Mobile Vision Applications (0) | 2024.07.10 |
---|---|
[GAN] Generative Adversarial Nets (0) | 2024.01.30 |
[DeConvNet] Learning Deconvolution Network for Semantic Segmentation (0) | 2023.06.08 |
[FCN] Fully Convolutional Networks for Semantic Segmentation (0) | 2023.03.31 |
[Transformer] Attention Is All You Need (2) (0) | 2023.03.24 |