3. 커널 작동법
- start with an image (width x height x depth)
depth의 3 : 컬러 영상 RGB 3가지의 정보를 담고 있기 때문에
- Focus on a small area only (5x5x3)
필터크기만큼!
- Get one number using the filter (w)
Receptive Field -> 출력의 한 영역
- 예시
3-1. Stride
- 필터가 stride 크기만큼 움직임!
- 위와 같이 7x7 input, stride=2가 적용된 3x3 filter는 output -> 3x3 이다
- stride 적용하며 영상 size를 유지하는 방법은 없을까? -> Zero Padding
4. 적용
4-1. Convolution Layers
- Swiping the entire image
4-2. Pooling Layer (sampling)
- 쉽게 말해 feature map을 resize한 것
- Max Pooling
▪ (2x2 filter를 사용하는 경우) 전체 데이터의 75%를 버리고 25%만 선택 -> Computational Complexity 감소
▪ Filter 내에서 가장 큰 값을 선택
Average pooling은 평균값을 선택
Average Pooling은 Spatial Structure를 보존하되 이미지가 smooth해짐
Max Pooling은 더 강한 특징만 남기는 방식
▪ Depth를 줄이지 않고 Spatially하게만 줄임 (높이 & 넓이)
4-3. Fully Connected Layer (FC layer)
- Contains neurons that connect to the entire input volume, as in ordinary Neural Neteorks
'Artificial Intelligence' 카테고리의 다른 글
The Lottery Ticket Hypothesis - 발표 (0) | 2022.04.28 |
---|---|
Rethinking the Value of Network Pruning - 발표 (0) | 2022.04.17 |
CNN 정리(1) (0) | 2022.02.14 |