컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석 8-3. Dilated Convolution

본 내용은 Edwith의 컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석을 요약 정리한 내용으로 DGIST 박상현 교수님과 Edwith, STAR-MOOC에 그 저작권이 있음을 미리 공지합니다.

Dilated Convolution(Atrous Convolution)

예를들어 3x3 Receptive Field가 존재할 때 일반적인 Filter의 형태가 아닌 떨어져 있는 kernel filter를 통해 계산을 진행합니다.

일반적인 방법

영상 Downsampling -> convolution -> Upsampling 빈 공간 사이를 interpolation

Pooling 이후 Upsampling

Dilated Convolution 효과

clear한 prediction map을 구할 수 있습니다.

Downsampling을 굳이 하지 않아도 됩니다.(해상도 유지 가능)

실제 학습 내부 파라미터는 차이가 거의 없습니다.

receptive field가 넓어질 뿐

DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

TPAMI 2018, citations 5686회(2020.09.19 기준)

DeeepLab-LargeFOV보다 DeepLab-ASPP의 성능이 더 높음을 확인하였습니다. 즉, Dilated Convolution과 Atrous Spatial Pyramid Pooling을 동시에 사용했을 때 성능이 더 좋음을 확인하였습니다.

version 2

Resnet처럼 skip connection 사용한 concatenate

Upsampling 해서 y와의 Loss를 구합니다.