분류 전체보기(82)
-
[논문 리뷰] Stand-Alone Self-Attention in Vision Models
Vision Transformer가 나오기 이전에도 self-attention을 computer vision 분야에 접목시키려는 많은 시도들이 있었다. 이번 논문은 그중에서 처음으로 self-attention만을 사용해서 모델을 만들었다. https://arxiv.org/abs/1906.05909 Stand-Alone Self-Attention in Vision Models Convolutions are a fundamental building block of modern computer vision systems. Recent approaches have argued for going beyond convolutions in order to capture long-range dependencies. T..
2022.03.09 -
[논문 리뷰] An Image is Worth 16x16 Words: Transformers for image Recognition at scale(VIT)
최근들어 필자가 가장 많은 관심을 가지고 있는 vision transformer가 처음 등장하는 논문이다. 물론 이 논문 이전에도 transformer를 vision 분야에 적용한 시도들이 있었지만, 실제로 vision분야에서 transformer가 널리 알려지게 된 것은 이 논문부터라고 해도 과언이 아니다. 한번 vision transformer를 뿌셔보자!! 1. Introduction Transformer in NLP Transformers는 NLP에서 먼저 언급된 개념이고 지금까지 dominant하게 쓰이는 approach이다. 기존에 NLP에서는 Sequence model(ex. RNN, LSTM)이 많이 사용되었는데 그러한 모델들은 순차적으로 token들을 넣어주어야 하기 때문에 gpu처리가 ..
2022.03.07 -
[논문리뷰] Unsupervised Pixel-level Domain Adaptation with GAN
GAN을 사용하여 unsupervised domain adaption을 한 논문이다. 조금 오래 전 논문임에도 불구하고 foreground에 대한 높은 reconstruction performance를 보여준다. 이제 자세하게 살펴보도록 하자!! https://arxiv.org/abs/1612.05424 Unsupervised Pixel-Level Domain Adaptation with Generative Adversarial Networks Collecting well-annotated image datasets to train modern machine learning algorithms is prohibitively expensive for many tasks. One appealing alter..
2022.02.28 -
[심층 학습] Linear Algebra (1)
12월 정도부터 Ian GoodFellow와 Yoshua Bengio의 Deep Learning이라는 책을 가지고 스터디를 하고 있는데, 난이도가 어느 정도 있는 편이라 차근 차근 정리를 해 나가려고 한다. 본인도 챕터가 지나면 지날 수록 이해가 안가거나 어려운 부분이 있으니 만약 내용이 틀렸거나 수정해야 할 부분이 있다면 댓글로 달아주길 바란다. 또한, 모르는 부분에 있어서는 글로 남겨두고 여러 사람들과 이에 대해 토론할 수 있었으면 좋겠다는 생각이 든다..ㅎㅎ 선형 대수와 확률 통계는 머신러닝과 딥러닝을 이해하는 데 있어서 중요한 도구로 많이 쓰인다. 이러한 학문의 범위는 매우 넓지만 이 책에서는 딥러닝에 필요한 부분만을 추려서 소개한다. 1. Scalars, Vectors, Matrices and..
2022.02.23 -
[논문 리뷰] Multimodal Unsupervised Image-to-Image Translation
1. Translate Image Task 출처(왼쪽): https://medium.com/jamieai/image-inpainting-with-deep-learning-dd8555e56a32 출처(가운데): https://pyimagesearch.com/2019/02/25/black-and-white-image-colorization-with-opencv-and-deep-learning/ 출처(오른쪽): https://stats.stackexchange.com/questions/400165/what-type-of-neural-network-is-used-for-image-style-transfer computer vision분야에서 이미지의 domain을 다른 domain으로 translate하는 문제..
2022.02.22