corenet/optims/scheduler/cosine.py

#
# For licensing see accompanying LICENSE file.
# Copyright (C) 2024 Apple Inc. All Rights Reserved.
#

import argparse
import math

from corenet.optims.scheduler import SCHEDULER_REGISTRY
from corenet.optims.scheduler.base_scheduler import BaseLRScheduler


@SCHEDULER_REGISTRY.register("cosine")
class CosineScheduler(BaseLRScheduler):
    """
    Cosine learning rate scheduler: https://arxiv.org/abs/1608.03983
    """

    def __init__(self, opts, **kwargs) -> None:
        is_iter_based = getattr(opts, "scheduler.is_iteration_based", True)
        super(CosineScheduler, self).__init__(opts=opts)

        max_iterations = getattr(opts, "scheduler.max_iterations", 150000)

        self.min_lr = getattr(opts, "scheduler.cosine.min_lr", 1e-5)
        self.max_lr = getattr(opts, "scheduler.cosine.max_lr", 0.4)

        if self.warmup_iterations > 0:
            self.warmup_step = (
                self.max_lr - self.warmup_init_lr
            ) / self.warmup_iterations

        self.period = (
            max_iterations - self.warmup_iterations + 1
            if is_iter_based
            else getattr(opts, "scheduler.max_epochs", 350)
        )

        self.is_iter_based = is_iter_based

    @classmethod
    def add_arguments(cls, parser: argparse.ArgumentParser) -> argparse.ArgumentParser:
        group = parser.add_argument_group(
            title="Cosine LR arguments", description="Cosine LR arguments"
        )

        group.add_argument(
            "--scheduler.cosine.min-lr",
            type=float,
            default=1e-5,
            help="Minimum LR in Cosine LR scheduler",
        )
        group.add_argument(
            "--scheduler.cosine.max-lr",
            type=float,
            default=0.1,
            help="Maximum LR in Cosine LR scheduler",
        )
        return parser

    def get_lr(self, epoch: int, curr_iter: int) -> float:
        if curr_iter < self.warmup_iterations:
            curr_lr = self.warmup_init_lr + curr_iter * self.warmup_step
            self.warmup_epochs = epoch
        else:
            if self.is_iter_based:
                curr_iter = curr_iter - self.warmup_iterations
                curr_lr = self.min_lr + 0.5 * (self.max_lr - self.min_lr) * (
                    1 + math.cos(math.pi * curr_iter / self.period)
                )
            else:
                adjust_num = self.warmup_epochs + 1 if self.adjust_period else 0
                adjust_den = self.warmup_epochs if self.adjust_period else 0
                curr_lr = self.min_lr + 0.5 * (self.max_lr - self.min_lr) * (
                    1
                    + math.cos(
                        math.pi * (epoch - adjust_num) / (self.period - adjust_den)
                    )
                )
        return max(0.0, curr_lr)

    def __repr__(self) -> str:
        repr_str = "{}(".format(self.__class__.__name__)
        repr_str += "\n \t min_lr={}\n \t max_lr={}\n \t period={}".format(
            self.min_lr, self.max_lr, self.period
        )
        if self.warmup_iterations > 0:
            repr_str += "\n \t warmup_init_lr={}\n \t warmup_iters={}".format(
                self.warmup_init_lr, self.warmup_iterations
            )

        repr_str += "\n )"
        return repr_str