Artificial Intelligence

CNN 정리(1)

yeonx 2022. 2. 14. 14:17
728x90

1. Limitation of DNN

1-1. 영상 데이터 (2D 데이터)에 DNN을 적용해 분류 문제를 풀 경우

-> 2D 데이터를 1D로 평탄화하여 DNN 적용 가능

-> 위치에 상관없이 동일한 수준의 중요도를 가짐

-> DNN = Multi-layer Perceptron = Feedforward NN = Fully Connected Layer (FC)

▶ 전체 글자에서 조금의 픽셀 이동만 생겨도 새로운 학습 데이터로 처리해야함 (translation invariance 특성이 보장되지 않음)

 

▶ 글자 크기(scale)가 달라지거나, 글자가 회전(rotation)하거나, 글자에 변형(distortion)이 생겨도 좋은 결과를 기대하기 어려움 ( scale / rotation / distortion invariance 특성이 보장되지 않음)

 

1-2. DNN의 한계 요약

▶ 학습시간(training time) : 크기, 회전, 이동 등 변형된 모든 데이터를 학습해야하는 이유로 오래걸림

▶ DNN 모델의 크기 (network size) : 입력 영상이 커지면 연결선이 기하 급수적으로 증가

▶ 변수의 개수 (number of parameters) : Layer가 깊어지면 모델 크기가 커진다 -> 파라미터 수 증가

 

2. Convolutional Neural Network

2-1. CNN이란 무엇인가?

- 합성곱 신경망(CNN)은 시각적 이미지를 분석하는 데 사용되는 깊은 인공신경망의 한 종류

- CNN은 변환 불변성 특성에 기초하며, 이미지 및 비디오 인식, 추천 시스템, 이미지 분류, 의료 이미지 분석에 응용

- CNN은 다른 이미지 분류 알고리즘에 비해 상대적으로 전처리를 거의 사용하지 않는다. 이는 네트워크가 기존 알고리즘에서 수작업으로 제작된 여러 필터 역할을 스스로 학습한다는 것을 의미

 

2-2. 영상처리 혹은 컴퓨터비전에서의 컨볼루션이란?

- Convolution은 주로 filter연산에서 사용되며, 영상으로부터 특정 feature를 추출하고 싶을 때 사용

(오른쪽 이미지에서)

Green:영상이미지 Yellow:컨볼루션이 일어나는 영역 Red:컨볼루션 커널

 

2-3. Convolution + Neural Network

- CNN -> Convolution특성을 살린 신경망 연상

- 2번 이상의 CNN, 입력 영상 뿐만 아니라 중간 Feature map에도 Convolution 적용

 

2-4. Receptive Field(수용영역)란 무엇인가?

- Receptive Field는 출력 레이어의 뉴런 하나에 영향을 미치는 입력 뉴런들의 공간 크기- 외부 자극이 전체 영향을 끼치는게 아니라 특정 영역에만 영향- 영상에서 특정 위치에 있는 픽셀들은 그 주변에 있는 일부 픽셀들과만 correlation이 높을 뿐이며, 거리가 멀어질수록 그 영향은 감소

 2-5. Advantage of CNN

- Conv layer는 형상을 유지

- 즉, 입/출력 모두 3차원 데이터로 처리하기 때문에 공간적 정보를 유지할 수 있다.

2-6. DNN vs CNN

'Artificial Intelligence' 카테고리의 다른 글

The Lottery Ticket Hypothesis - 발표  (0) 2022.04.28
Rethinking the Value of Network Pruning - 발표  (0) 2022.04.17
CNN 정리(2)  (0) 2022.02.14