[데이터] 데이터 준비 단계(CIFAR-100)
2021. 6. 24. 16:19ㆍ코딩연습장/Keras
딥러닝 모델을 Keras를 이용해서 Classification부터 차례차례 만들어보려고 한다.
훈련에 앞서 먼저 학습 및 테스트 데이터셋이 필요하다. 나는 유명한 데이터셋 중에서 적당한 크기의 CIFAR-100데이터셋을 사용하기로 하였다.
이 글에서는 CIFAR-100 데이터셋을 어떻게 파이썬에서 불러올 지에 관한 내용을 다룰 것이다.
CIFAR-10, CIFAR-100, MNIST 등 유명한 데이터셋들은 Keras 내부 모듈을 이용하여 다운 및 로드가 가능하다.
이 방법 외에도
https://www.cs.toronto.edu/~kriz/cifar.html
위 사이트에서 직접 다운로드 받아 사용하는 방법이 있지만 굳이 추천하지 않는다.
코드는 매우 간단하다.
from keras.datasets import cifar100
def get_cifar100():
(x_train, y_train), (x_test, y_test) = cifar100.load_data()
return x_train, y_train, x_test, y_test
자신이 사용하고 싶은 데이터셋(ex. cifar10 or mnist)에 따라서 이름만 바꾸어주면 된다.
위의 코드를 실행할 시에 자동으로 서버에서 해당하는 데이터셋을 다운받아온다.
**단, 중간에 어떠한 오류로 인해 설치가 중단될 시, 처음부터 다시 받아야한다.
'코딩연습장 > Keras' 카테고리의 다른 글
[Keras] Generator 만들기 (2) | 2021.07.08 |
---|---|
[데이터 증강] IMGAUG 모듈 (0) | 2021.07.08 |
[데이터 준비] Tiny-Imagenet (3) | 2021.06.29 |
[Classification] ResNet 코딩 (0) | 2021.06.29 |
[Classificaiton] VGGNET 모델 코딩 (2) | 2021.06.24 |