본 내용은 Edwith의 컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석을 요약 정리한 내용으로 DGIST 박상현 교수님과 Edwith, STAR-MOOC에 그 저작권이 있음을 미리 공지합니다.
URL : https://www.edwith.org/medical-20200327/lecture/63134/
LeNet-5, AlexNet, VGG
ResNet, Inception, DenseNet
padding 없이 conv 사용(사이즈가 줄어들음)
Average Pooling을 사용했었습니다.
Feature map size가 줄어들기 때문에 Channel을 늘려줬습니다.
LeCun et al., 1998. Gradient-based learning applied to document recognition
227x227x3을 input으로 넣기 때문에 stride를 크게 하여 사이즈를 줄였습니다.
Max Pooling을 사용
Activation Function을 ReLU를 처음으로 사용함
Krizhevsky et al., 2012. ImageNet classification with deep convolutional neural networks
http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
일반적인 구조 : CNN, Pooling layer의 혼용 이후 FC, Softmax 구조