Preset Manager¶

The Preset Manager is an intelligent system that helps you choose the best transform backend (torchvision vs albumentations) based on your specific task and requirements.

Backend Selection Workflow¶

graph TD
    A[Task Requirements] --> A1[Define Task Type]
    A1 --> A2[Identify Constraints]
    A2 --> A3[List Data Types]
    A3 --> B{recommend_backend}

    B --> B1[Analyze Requirements]
    B1 --> B2[Check Data Types]
    B2 --> C{Has BBoxes/Masks?}

    C -->|Yes - Need Spatial Transforms| D1[albumentations]
    D1 --> D1a[Supports BBox/Mask]
    D1a --> D1b[Synchronized Transforms]

    C -->|No| E{Advanced Aug?}
    E -->|Yes - Need Features| D1
    E1[Complex Augmentations]
    E1 --> E2[Morphological Ops]
    E2 --> D1

    E -->|No| F{Prioritize Speed?}

    F -->|Yes - Need Performance| D2[torchvision]
    D2 --> D2a[Native PyTorch]
    D2a --> D2b[Optimized C++]
    D2b --> D2c[Faster Execution]

    F -->|No - Need Flexibility| D1

    D1b --> G1[Preset Selection]
    D2c --> G2[Preset Selection]

    G1 --> G1a[Choose Preset]
    G1a -->|Detection/Seg| H1[default/strong]
    H1 --> H1a[BBox-aware Transforms]
    H1a --> H1b[Mask-aware Transforms]
    H1b --> H1c[Advanced Augmentation]

    G2 --> G2a[Choose Preset]
    G2a -->|Classification| H2[default/randaugment]
    H2 --> H2a[Simple Transforms]
    H2a --> H2b[RandAugment Policy]
    H2b --> H2c[Fast Execution]

    H1c --> I[TransformConfig]
    H2c --> I

    I --> I1[Create Config Object]
    I1 --> I2[Set Backend]
    I2 --> I3[Set Preset]
    I3 --> I4[Configure Params]
    I4 --> J[DataModule]

    J --> J1[Apply to DataModule]
    J1 --> J2[Build Transform Pipeline]
    J2 --> J3[Create DataLoaders]
    J3 --> J4[Ready for Training]

    style A fill:#2196F3,stroke:#1976D2
    style B fill:#1976D2,stroke:#1565C0
    style D1 fill:#2196F3,stroke:#1976D2
    style D2 fill:#1976D2,stroke:#1565C0
    style H1 fill:#2196F3,stroke:#1976D2
    style I fill:#1976D2,stroke:#1565C0
    style J fill:#2196F3,stroke:#1976D2
    style J4 fill:#1976D2,stroke:#1565C0

Quick Start¶

import autotimm as at  # recommended alias
from autotimm import recommend_backend

# Get a recommendation for your task
rec = recommend_backend(task="detection")
print(rec)

Output:

Recommended Backend: albumentations
Recommended Preset: default

Reasoning: Object Detection requires bbox/mask-aware transforms. 
Albumentations provides built-in support for synchronized transforms.

Available presets for albumentations:
  - default
  - strong
  - light

Core Functions¶

`recommend_backend()`¶

Get an intelligent recommendation for the best transform backend.

from autotimm import recommend_backend

recommendation = recommend_backend(
    task="classification",  # or "detection", "segmentation", "instance_segmentation"
    needs_advanced_augmentation=False,
    needs_spatial_transforms=False,
    prioritize_speed=False,
    has_bbox_or_masks=False,
)

Parameters:

task (optional): Type of vision task
"classification": Image classification
"detection": Object detection
"segmentation": Semantic segmentation
"instance_segmentation": Instance segmentation
needs_advanced_augmentation: Whether you need advanced augmentations like geometric transforms, blur, noise, etc.
needs_spatial_transforms: Whether you need spatial transforms like rotation, affine, elastic transforms
prioritize_speed: Whether to prioritize transform speed over flexibility
has_bbox_or_masks: Whether your data includes bounding boxes or masks that need to be transformed together with images

Returns: BackendRecommendation object with: - backend: Recommended backend ("torchvision" or "albumentations") - preset: Recommended preset for that backend - reasoning: Explanation for the recommendation - available_presets: List of all available presets - alternative: Alternative option with reasoning (if applicable)

`compare_backends()`¶

Compare torchvision and albumentations backends side-by-side.

from autotimm import compare_backends

# Print detailed comparison table
comparison = compare_backends(verbose=True)

# Or get data programmatically
comparison = compare_backends(verbose=False)
print(comparison['torchvision']['presets'])
print(comparison['albumentations']['best_for'])

Usage Examples¶

Example 1: Simple Classification¶

from autotimm import recommend_backend, ImageClassifier, MetricConfig

# Get recommendation
rec = recommend_backend(task="classification")

# Convert to config
config = rec.to_config(image_size=224)

# Use in model
metrics = [
    MetricConfig(
        name="accuracy",
        backend="torchmetrics",
        metric_class="Accuracy",
        params={"task": "multiclass", "num_classes": 10},
        stages=["train", "val"],
        prog_bar=True,
    ),
]

model = ImageClassifier(
    backbone="resnet18",
    num_classes=10,
    transform_config=config,
    metrics=metrics,
)

Example 2: Object Detection¶

from autotimm import recommend_backend, ObjectDetector

# Detection automatically recommends albumentations
rec = recommend_backend(task="detection")
print(f"Using {rec.backend} with preset '{rec.preset}'")

# Create config with detection-specific settings
config = rec.to_config(
    image_size=640,
    min_bbox_area=10,
    min_visibility=0.3,
)

model = ObjectDetector(
    backbone="resnet50",
    num_classes=80,
)

Example 3: Advanced Classification¶

from autotimm import recommend_backend

# Need strong augmentation for small dataset
rec = recommend_backend(
    task="classification",
    needs_advanced_augmentation=True,
    needs_spatial_transforms=True,
)

# This will recommend albumentations with 'strong' preset
config = rec.to_config(image_size=384)
print(f"Backend: {config.backend}, Preset: {config.preset}")
# Output: Backend: albumentations, Preset: strong

Example 4: Speed-Optimized Pipeline¶

from autotimm import recommend_backend

# Prioritize speed for inference
rec = recommend_backend(prioritize_speed=True)

# This recommends torchvision with 'light' preset
config = rec.to_config(image_size=224)

Example 5: Comparing Backends¶

from autotimm import compare_backends

# View full comparison
comparison = compare_backends(verbose=True)

# Access specific information
tv_pros = comparison['torchvision']['pros']
albu_pros = comparison['albumentations']['pros']

print("Torchvision advantages:")
for pro in tv_pros:
    print(f"  + {pro}")

Decision Matrix¶

The Preset Manager uses the following logic to make recommendations:

Task	Requirements	Recommended Backend	Recommended Preset
Classification	Default	Torchvision	randaugment
Classification	Advanced augmentation	Albumentations	strong
Detection	Any	Albumentations	default
Segmentation	Any	Albumentations	default
Instance Segmentation	Any	Albumentations	default
Any	Spatial transforms needed	Albumentations	strong
Any	BBox/masks present	Albumentations	default
Any	Speed priority (no bbox/masks)	Torchvision	light

Backend Comparison¶

Torchvision¶

Best for:

Image classification
Quick prototyping
Simple augmentation pipelines
When speed is critical (for basic transforms)

Pros:

Built into PyTorch ecosystem
Fast for basic transforms
Well-documented
No extra dependencies (included in AutoTimm)

Cons:

Limited spatial transforms
No built-in bbox/mask handling
Fewer augmentation options

Available Presets:

default: RandomResizedCrop, HorizontalFlip, ColorJitter
autoaugment: AutoAugment (ImageNet policy)
randaugment: RandAugment with configurable ops/magnitude
trivialaugment: TrivialAugmentWide
light: RandomResizedCrop, HorizontalFlip only

Albumentations¶

Best for:

Object detection
Semantic/instance segmentation
Advanced augmentation pipelines
Spatial transforms (rotation, affine, elastic)

Pros:

Rich augmentation library (80+ transforms)
Built-in bbox/mask support
Spatial transforms (affine, elastic, etc.)
Highly optimized (included in AutoTimm)

Cons:

Slightly more complex API
OpenCV-based (different from PIL)

Available Presets:

default: RandomResizedCrop, HorizontalFlip, ColorJitter
strong: Affine, blur/noise, ColorJitter, CoarseDropout
light: RandomResizedCrop, HorizontalFlip only

API Reference¶

BackendRecommendation¶

@dataclass
class BackendRecommendation:
    backend: Literal["torchvision", "albumentations"]
    preset: str
    reasoning: str
    available_presets: list[str]
    alternative: str | None = None

    def to_config(self, **kwargs) -> TransformConfig:
        """Convert to TransformConfig with optional overrides."""
        ...

recommend_backend()¶

def recommend_backend(
    task: Literal["classification", "detection", "segmentation", "instance_segmentation"] | None = None,
    needs_advanced_augmentation: bool = False,
    needs_spatial_transforms: bool = False,
    prioritize_speed: bool = False,
    has_bbox_or_masks: bool = False,
) -> BackendRecommendation:
    """Recommend the best transform backend based on requirements."""
    ...

compare_backends()¶

def compare_backends(verbose: bool = True) -> dict[str, dict]:
    """Compare torchvision and albumentations backends."""
    ...

Preset Manager¶

Backend Selection Workflow¶

Quick Start¶

Core Functions¶

recommend_backend()¶

compare_backends()¶

Usage Examples¶

Example 1: Simple Classification¶

Example 2: Object Detection¶

Example 3: Advanced Classification¶

Example 4: Speed-Optimized Pipeline¶

Example 5: Comparing Backends¶

Decision Matrix¶

Backend Comparison¶

Torchvision¶

Albumentations¶

API Reference¶

BackendRecommendation¶

recommend_backend()¶

compare_backends()¶

See Also¶

`recommend_backend()`¶

`compare_backends()`¶