다음 글은 파이토치 코리아 기본 익히기 글을 참고하여 작성하였습니다.

 


Dataset과 Dataloader

PyTorch는 가지고 있는 데이터의 다양한 입력 형태를 정의하는 클래스로 Dataset을 제공하고,

이 Dataset을 사용하여 모델이 학습하기 직전 순회가능한 객체(iterable)로 (Tensor로 변환 및 병렬처리를 위한 Batch 처리)감쌉니다.

 

Dataset

torch.utils.data.Dataset

  • 데이터의 입력 형태를 정의합니다.
  • Image, Text, Audio, Video 등에 따른 다양한 입력을 정의해줍니다.

 

DataLoader

torch.utils.data.DataLoader

  • 데이터셋의 특징을 가져오고 하나의 샘플에 정답(label)을 지정하는 일을 반복합니다.
  • 학습 직전 데이터의 변환을 책임집니다. (Tensor로 변환, 순회 가능한 묶음(batch)을 반환)

 

'ML & DL > PyTorch' 카테고리의 다른 글

[PyTorch] Optimization, 최적화  (0) 2023.03.13
[PyTorch] Autograd, 자동 미분  (0) 2023.03.13
[PyTorch] 텐서(Tensor)  (0) 2023.03.13
PyTorch 란 ?  (0) 2023.03.13
[Pytorch] Mixed Precision Training  (0) 2021.12.04
욱근욱