다음 글은 파이토치 코리아의 기본 익히기 글을 참고하여 작성하였습니다.
Dataset과 Dataloader
PyTorch는 가지고 있는 데이터의 다양한 입력 형태를 정의하는 클래스로 Dataset을 제공하고,
이 Dataset을 사용하여 모델이 학습하기 직전 순회가능한 객체(iterable)로 (Tensor로 변환 및 병렬처리를 위한 Batch 처리)감쌉니다.
Dataset
torch.utils.data.Dataset
- 데이터의 입력 형태를 정의합니다.
- Image, Text, Audio, Video 등에 따른 다양한 입력을 정의해줍니다.
DataLoader
torch.utils.data.DataLoader
- 데이터셋의 특징을 가져오고 하나의 샘플에 정답(label)을 지정하는 일을 반복합니다.
- 학습 직전 데이터의 변환을 책임집니다. (Tensor로 변환, 순회 가능한 묶음(batch)을 반환)
'ML & DL > PyTorch' 카테고리의 다른 글
[PyTorch] Optimization, 최적화 (0) | 2023.03.13 |
---|---|
[PyTorch] Autograd, 자동 미분 (0) | 2023.03.13 |
[PyTorch] 텐서(Tensor) (0) | 2023.03.13 |
PyTorch 란 ? (0) | 2023.03.13 |
[Pytorch] Mixed Precision Training (0) | 2021.12.04 |