[데이터] 데이터 준비 단계(CIFAR-100)

2021. 6. 24. 16:19코딩연습장/Keras

딥러닝 모델을 Keras를 이용해서 Classification부터 차례차례 만들어보려고 한다.

 

훈련에 앞서 먼저 학습 및 테스트 데이터셋이 필요하다. 나는 유명한 데이터셋 중에서 적당한 크기의 CIFAR-100데이터셋을 사용하기로 하였다.

 

이 글에서는 CIFAR-100 데이터셋을 어떻게 파이썬에서 불러올 지에 관한 내용을 다룰 것이다.


CIFAR-10, CIFAR-100, MNIST 등 유명한 데이터셋들은 Keras 내부 모듈을 이용하여 다운 및 로드가 가능하다.

 

이 방법 외에도 

https://www.cs.toronto.edu/~kriz/cifar.html

 

CIFAR-10 and CIFAR-100 datasets

< Back to Alex Krizhevsky's home page The CIFAR-10 and CIFAR-100 are labeled subsets of the 80 million tiny images dataset. They were collected by Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton. The CIFAR-10 dataset The CIFAR-10 dataset consists of 60000

www.cs.toronto.edu

 

위 사이트에서 직접 다운로드 받아 사용하는 방법이 있지만 굳이 추천하지 않는다

 

코드는 매우 간단하다.

from keras.datasets import cifar100

def get_cifar100():
    (x_train, y_train), (x_test, y_test) = cifar100.load_data()
    return x_train, y_train, x_test, y_test

 

자신이 사용하고 싶은 데이터셋(ex. cifar10 or mnist)에 따라서 이름만 바꾸어주면 된다. 

 

위의 코드를 실행할 시에 자동으로 서버에서 해당하는 데이터셋을 다운받아온다.

**단, 중간에 어떠한 오류로 인해 설치가 중단될 시, 처음부터 다시 받아야한다.

 

 

'코딩연습장 > Keras' 카테고리의 다른 글

[Keras] Generator 만들기  (2) 2021.07.08
[데이터 증강] IMGAUG 모듈  (0) 2021.07.08
[데이터 준비] Tiny-Imagenet  (3) 2021.06.29
[Classification] ResNet 코딩  (0) 2021.06.29
[Classificaiton] VGGNET 모델 코딩  (2) 2021.06.24