torchvision
PyTorch에서 제공하는 이미지 및 비디오 데이터를 다루기 위한 라이브러리 입니다.
- CIFAR, COCO, MNIST, ImageNet 과 같은 일반적인 데이터셋을 로드할 수 있습니다.
- VGG, ResNet, Inception 등과 같은 이미지 분류에 사용되는 미리 학습된(pre-trained) 모델을 제공합니다.
- Transfrom, 이미지를 전처리하는데 사용되는 다양한 함수를 제공합니다.
- Utils, 다양한 작업을 수행하기 위한 유틸리티 함수들을 제공합니다.
transform
이미지의 크기를 조정하거나, 랜덤으로 좌우 반저을 적용하거나, 색상을 조정하건, 이미지를 정규화 하는 등 다양한 이미지 전처리 작업을 할 수 있는 함수입니다.
- 원본 이미지
- transforms.Resize
이미지의 사이즈를 변환합니다.
- transforms.RandomCrop
지정된 이미지를 임의의 위치에서 자릅니다.
- transforms.RandomRotation
주어진 이미지를 임의의 각도로 회전합니다.
이외에도 다양한 함수를 제공하고 있습니다. 다음에서 확인할 수 있습니다.
Albumentations
torchvision의 transform 외에도 albumentations 라이브러리를 사용하여 이미지 처리가 가능합니다.
다음은 제가 정리해놓은 글입니다.
imgaug
Object Dection의 경우 물체의 위치 정보 (Bounding Box) 까지 함께 변환되어야 합니다.이를 제공해주는 라이브러리가 imgaug 입니다.
https://github.com/aleju/imgaug
'ML & DL > PyTorch' 카테고리의 다른 글
[Pytroch] Multi GPU Training (0) | 2023.05.31 |
---|---|
[PyTorch] Dataset & DataLoader (0) | 2023.03.15 |
[PyTorch] nn.Module (0) | 2023.03.15 |
[PyTorch] torch.nn (0) | 2023.03.15 |
[PyTorch] Optimization, 최적화 (0) | 2023.03.13 |