인공지능/딥러닝 모델(3)
-
[Detection] YOLO (You Only Look Once)
You Only Look Once: Unified, Real-Time Object Detection Object detection task에서 좋은 성능을 보였던 RCNN 계열은 성능은 좋지만 end-to-end 학습이 안되고 stage에 따라 학습을 여러 번 해야하는 번거로움이 있었다. 또한, region proposal과 같은 방법은 window 마다 모델을 통과시켜야 하였기 때문에 속도 측면에서 매우 큰 단점을 가졌다. YOLO는 위와 같은 단점을 해결하고자 문제를 regression task로 바꾸어 하나의 모델로 end-to-end 학습을 할 수 있도록 만든 방법이다. https://arxiv.org/abs/1506.02640 You Only Look Once: Unified, Real-Time..
2022.09.06 -
[분류모델] ResNet
이번에는 기본 CNN에서 조금 구조적으로 진화된 Network를 살펴보려고한다. 지난번 VGGNet같은 경우, 단순 CNN에 3x3필터를 이용하였는데 ResNet은 Residual이라는 조금 새로운 모델 구조를 선보였다. 지금까지도 여러 모델에 Residual이라는 개념이 사용될 정도이니, 이러한 아이디어를 고안한 것이 딥러닝에 얼마나 큰 기여를 하였는지 이해할 수 있을 것이다. 1. ResNet의 배경 ResNet은 Kaiming He라는 연구자에 의해 개발되었다(실질적으로는 그 연구팀). 딥러닝을 배우다보면 layer를 깊게 만드는 것이 성능을 높여주는 방법이라고 들은 적이 있을 것이다. 원래 과거에는 하드웨어의 한계로 인해 이 layer를 너무 깊게 쌓는 것이 불가능 하였는데, 20세기에 들어서면서..
2021.06.28 -
[분류모델] VGGNET
제목은 분류모델로 써놓았지만 이 카테고리에 쓸 모델들은 Object Detection, Segmentation 등 등 다른 Task의 기반이 되는 backbone 역할을 해준다고 보면 된다. 이러한 backbone 모델의 성능에 따라 딥러닝의 성능은 천차만별로 달라지게 된다. 제일 처음 알아볼 모델은 VGGNET이다. 딥러닝을 처음 배우는 사람들이라도 많이 들어보았을 정도로 CNN모델의 기초가 되는 모델이다. VGGNet은 2014년도 ILSVRC에서 처음 등장하였다. 아쉽게 GoogleNet에게 1등 자리를 빼았겼지만 유명세와 인용 측면에서는 VGGNet이 우세하였는데, 그 이유는 모델의 복잡성 때문이다. Inception(GoogleNet) 모델을 살펴보면 알겠지만 구조가 매우 복잡하고, 난해하다. ..
2021.06.24