본 내용은 Edwith의 컴퓨터비전, 머신러닝, 딥러닝을 이용한 의료영상분석을 요약 정리한 내용으로 DGIST 박상현 교수님과 Edwith, STAR-MOOC에 그 저작권이 있음을 미리 공지합니다.
URL : https://www.edwith.org/medical-20200327/lecture/63133/
Convolutional Layer -> Pooling Layer -> Fully Connected Layer 순서
RGB에 대한 image를 input으로 넣는다. 단, 이때 같은 채널(=3개 : RGB)의 filter를 여러개 사용한 conv layer를 통하여 통과시켜 feature map을 만드는 방향으로 학습을 진행합니다.
몇 칸씩 건너뛸지를 결정하는 것 : Stride hyperparameter
일반적으로 conv layer를 통과시키면 사이즈가 줄어들지만 padding을 통해 사이즈를 유지시킬 수도 있습니다. 이 역시 hyperparameter
Image 사이즈를 줄이는 Layer
일반적으로 Max Pooling을 많이 사용합니다.
그 이유로 local 부분에서 중요한 특징들이 잘 나타낼 수 있도록 하기 위해 Max Pooling을 많이 사용하는 것이 Classification 성능을 높인다는 연구 결과들이 있기 때문
Average Pooling을 사용할 수도 있습니다.
pooling의 경우 parameter가 필요하지 않습니다.
충분히 작아진 feature map 값들에 대해 모든 layer의 weight들이 존재하도록 연결한 상태.
parameter를 계산할 때 각 pixel별 bias 또한 고려