-
CNN (4) | Object Detection Strategies (1) | 패스트캠퍼스 챌린지 33일차딥러닝 2022. 2. 25. 22:45
Object detection을 위한 전략은 2010년대를 거치면서 많이 발전해왔다. 가장 기초적으로는 sliding window detection, 즉 윈도우를 움직이면서 객체를 찾아내는 방식이 있을 수 있다. 그 다음으로는 Proposal Approach가 있었는데, 이는 window를 sliding하면서 객체가 있으리라 예상되는 부분에서 detection 결과를 내보내는 것이 아닌, 모든 window를 우선 찾은 후 window들을 다중분류 하는 방법을 뜻한다. Voting for patches and keypoints는 핵심이 되리라는 영역을 많이 뽑은 뒤, 이 영역에 대해 일종의 투표 과정을 거쳐 객체를 찾는 과정이다.
Selective search는 segmentation 기반의 object proposal이다. 즉, segmentation을 무수히 진행한 다음, 반복적인 segmentation grouping을 통해 유사도가 높은 곳들을 하나의 object로 판단하는 과정인 듯 하다. 이러한 방식에 CNN을 더한 방식이 바로 R-CNN이다. R-CNN은 selective search 기법에 CNN feature를 덧붙여 이를 선형 서포트 벡터 머신을 통해 분류하는 과정을 거치며, 성능이 높았지만, 속도가 느리다는 치명적인 단점이 있었따. 이로 인해 이 다음 전략들은 속도를 높이는데 집중한다. Spatial Pyramid Pooling Netowork, Fast R-CNN은 R-CNN에 비해 속도 향상을 꾀할 수 있었지만, 그 결과는 3-4 fps 정도여서 최소 24fps는 되어야 하는 동영상을 처리하기에는 무리가 있었다. Faster R-CNN은 이름 그대로 Fast R-CNN보다 더 빠른 모델로, 이는 selective search를 포기함으로써 24fps에 근접한 속도를 보장받을 수 있었다.
한 편, You Only Look Once(YOLO)는 regional proposal 없이 한번에 객체 발견을 수행하는 모델이다. 구체적으로, 이미지를 그리드로 나눈 뒤, bounding boxes를 예측하고, Intersection over Union을 기반으로 한 Confidence Score를 계산하여 객체를 찾는 과정이다.
Single Shot Multi-box Detection은 다른 사이즈의 feature map을 찾아내는 역할을 해 냈으며, Feature Pyramid Networks는 작은 물체를 탐지하지 못한다는 기존 모델들의 단점을 보완한 모델이다.
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다. https://bit.ly/37BpXiC
'딥러닝' 카테고리의 다른 글
RNN (1) | RNN의 기초 | 패스트캠퍼스 챌린지 35일차 (0) 2022.02.27 CNN (5) | Object Detection Strategies (2) | 패스트캠퍼스 챌린지 34일차 (0) 2022.02.26 CNN (3) | 패스트캠퍼스 챌린지 32일차 (0) 2022.02.24 CNN (2) | 패스트캠퍼스 챌린지 31일차 (0) 2022.02.23 CNN (1) | CNN의 개요 | 패스트캠퍼스챌린지 30일차 (0) 2022.02.22