Artificial Intelligence

CNN 정리(2)

yeonx 2022. 2. 14. 16:06
728x90

3. 커널 작동법

커널 작동법

- start with an image (width x height x depth)

  depth의 3 : 컬러 영상 RGB 3가지의 정보를 담고 있기 때문에 

- Focus on a small area only (5x5x3)

  필터크기만큼!

- Get one number using the filter (w)

  Receptive Field -> 출력의 한 영역

- 예시

 

3-1. Stride

- 필터가 stride 크기만큼 움직임!

stride=2

- 위와 같이 7x7 input, stride=2가 적용된 3x3 filter는 output -> 3x3 이다

- stride 적용하며 영상 size를 유지하는 방법은 없을까? -> Zero Padding

4. 적용

4-1. Convolution Layers

 - Swiping the entire image

4-2. Pooling Layer (sampling)

- 쉽게 말해 feature map을 resize한 것

- Max Pooling

(2x2 filter를 사용하는 경우) 전체 데이터의 75%를 버리고 25%만 선택 -> Computational Complexity 감소

Filter 내에서 가장 큰 값을 선택

   Average pooling은 평균값을 선택

   Average Pooling은 Spatial Structure를 보존하되 이미지가 smooth해짐

   Max Pooling은 더 강한 특징만 남기는 방식

▪ Depth를 줄이지 않고 Spatially하게만 줄임 (높이 & 넓이)

 

4-3. Fully Connected Layer (FC layer)

- Contains neurons that connect to the entire input volume, as in ordinary Neural Neteorks

'Artificial Intelligence' 카테고리의 다른 글

The Lottery Ticket Hypothesis - 발표  (0) 2022.04.28
Rethinking the Value of Network Pruning - 발표  (0) 2022.04.17
CNN 정리(1)  (0) 2022.02.14