Source code for ax.benchmark.testing.benchmark_stubs

#!/usr/bin/env python3
# Copyright (c) Meta Platforms, Inc. and affiliates.
#
# This source code is licensed under the MIT license found in the
# LICENSE file in the root directory of this source tree.

# pyre-strict
from collections.abc import Iterator
from dataclasses import dataclass, field
from typing import Any

import pandas as pd
import torch
from ax.adapter.torch import TorchAdapter
from ax.benchmark.benchmark_method import BenchmarkMethod
from ax.benchmark.benchmark_metric import (
    BenchmarkMapMetric,
    BenchmarkMapUnavailableWhileRunningMetric,
    BenchmarkMetric,
    BenchmarkTimeVaryingMetric,
)
from ax.benchmark.benchmark_problem import (
    BenchmarkProblem,
    get_moo_opt_config,
    get_soo_opt_config,
)
from ax.benchmark.benchmark_result import AggregatedBenchmarkResult, BenchmarkResult
from ax.benchmark.benchmark_step_runtime_function import TBenchmarkStepRuntimeFunction
from ax.benchmark.benchmark_test_function import BenchmarkTestFunction
from ax.benchmark.benchmark_test_functions.surrogate import SurrogateTestFunction
from ax.benchmark.benchmark_test_functions.synthetic import IdentityTestFunction
from ax.benchmark.problems.surrogate.lcbench.data import LCBenchData
from ax.benchmark.problems.surrogate.lcbench.utils import get_lcbench_parameters
from ax.benchmark.problems.synthetic.from_botorch import create_problem_from_botorch
from ax.benchmark.problems.synthetic.hss.jenatton import get_jenatton_search_space
from ax.core.arm import Arm
from ax.core.batch_trial import BatchTrial
from ax.core.data import Data
from ax.core.experiment import Experiment
from ax.core.parameter import ChoiceParameter, ParameterType
from ax.core.search_space import SearchSpace
from ax.core.trial import Trial
from ax.core.types import TParameterization, TParamValue
from ax.early_stopping.strategies.base import BaseEarlyStoppingStrategy
from ax.generation_strategy.external_generation_node import ExternalGenerationNode
from ax.generation_strategy.generation_strategy import GenerationStrategy
from ax.generators.torch.botorch_modular.generator import BoTorchGenerator
from ax.generators.torch.botorch_modular.surrogate import ModelConfig, SurrogateSpec
from ax.utils.testing.core_stubs import (
    get_branin_experiment,
    get_branin_experiment_with_multi_objective,
)
from botorch.models.fully_bayesian import SaasFullyBayesianSingleTaskGP
from botorch.test_functions.multi_objective import BraninCurrin
from botorch.test_functions.synthetic import Branin



[docs]
def get_single_objective_benchmark_problem(
    observe_noise_sd: bool = False,
    num_trials: int = 4,
    test_problem_kwargs: dict[str, Any] | None = None,
    report_inference_value_as_trace: bool = False,
    noise_std: float | dict[str, float] = 0.0,
    status_quo_params: TParameterization | None = None,
) -> BenchmarkProblem:
    return create_problem_from_botorch(
        test_problem_class=Branin,
        test_problem_kwargs=test_problem_kwargs or {},
        num_trials=num_trials,
        observe_noise_sd=observe_noise_sd,
        report_inference_value_as_trace=report_inference_value_as_trace,
        noise_std=noise_std,
        status_quo_params=status_quo_params,
        baseline_value=3,
    )




[docs]
def get_multi_objective_benchmark_problem(
    observe_noise_sd: bool = False,
    num_trials: int = 4,
    test_problem_class: type[BraninCurrin] = BraninCurrin,
    report_inference_value_as_trace: bool = False,
) -> BenchmarkProblem:
    return create_problem_from_botorch(
        test_problem_class=test_problem_class,
        test_problem_kwargs={},
        num_trials=num_trials,
        observe_noise_sd=observe_noise_sd,
        report_inference_value_as_trace=report_inference_value_as_trace,
        baseline_value=0.0,
    )




[docs]
def get_soo_surrogate_test_function(lazy: bool = True) -> SurrogateTestFunction:
    experiment = get_branin_experiment(with_completed_trial=True)
    surrogate = TorchAdapter(
        experiment=experiment,
        search_space=experiment.search_space,
        generator=BoTorchGenerator(),
        data=experiment.lookup_data(),
        transforms=[],
    )
    if lazy:
        test_function = SurrogateTestFunction(
            outcome_names=["branin"], name="test", get_surrogate=lambda: surrogate
        )
    else:
        test_function = SurrogateTestFunction(
            outcome_names=["branin"],
            name="test",
            _surrogate=surrogate,
        )
    return test_function




[docs]
def get_soo_surrogate() -> BenchmarkProblem:
    experiment = get_branin_experiment(with_completed_trial=True)
    test_function = get_soo_surrogate_test_function()

    optimization_config, opt_config_metrics = get_soo_opt_config(
        outcome_names=test_function.outcome_names,
        observe_noise_sd=True,
    )

    return BenchmarkProblem(
        name="test",
        search_space=experiment.search_space,
        optimization_config=optimization_config,
        num_trials=6,
        optimal_value=0.0,
        baseline_value=3.0,
        test_function=test_function,
        opt_config_metrics=opt_config_metrics,
    )




[docs]
def get_moo_surrogate() -> BenchmarkProblem:
    experiment = get_branin_experiment_with_multi_objective(with_completed_trial=True)
    surrogate = TorchAdapter(
        experiment=experiment,
        search_space=experiment.search_space,
        generator=BoTorchGenerator(),
        data=experiment.lookup_data(),
        transforms=[],
    )

    outcome_names = ["branin_a", "branin_b"]
    test_function = SurrogateTestFunction(
        name="test", outcome_names=outcome_names, get_surrogate=lambda: surrogate
    )
    optimization_config, opt_config_metrics = get_moo_opt_config(
        outcome_names=outcome_names,
        ref_point=[0.0, 0.0],
        observe_noise_sd=True,
    )

    return BenchmarkProblem(
        name="test",
        search_space=experiment.search_space,
        optimization_config=optimization_config,
        num_trials=10,
        optimal_value=1.0,
        baseline_value=0.0,
        test_function=test_function,
        opt_config_metrics=opt_config_metrics,
    )




[docs]
def get_benchmark_result(seed: int = 0) -> BenchmarkResult:
    problem = get_single_objective_benchmark_problem()

    return BenchmarkResult(
        name="test_benchmarking_result",
        seed=seed,
        experiment=Experiment(
            name="test_benchmarking_experiment",
            search_space=problem.search_space,
            optimization_config=problem.optimization_config,
            is_test=True,
        ),
        inference_trace=[1.0, 1.0, 1.0, 1.0],
        oracle_trace=[0.0, 0.0, 0.0, 0.0],
        cost_trace=[0.0, 0.0, 0.0, 0.0],
        num_trials=[1, 2, 3, 4],
        optimization_trace=[3.0, 2.0, 1.0, 0.1],
        score_trace=[3.0, 2.0, 1.0, 0.1],
        is_feasible_trace=[True, True, True, True],
        fit_time=0.1,
        gen_time=0.2,
    )




[docs]
def get_aggregated_benchmark_result() -> AggregatedBenchmarkResult:
    result = get_benchmark_result()
    return AggregatedBenchmarkResult.from_benchmark_results([result, result])




[docs]
@dataclass(kw_only=True)
class DummyTestFunction(BenchmarkTestFunction):
    outcome_names: list[str] = field(default_factory=list)
    num_outcomes: int = 1
    dim: int = 6

    def __post_init__(self) -> None:
        self.outcome_names = [f"objective_{i}" for i in range(self.num_outcomes)]

    # pyre-fixme[14]: Inconsistent override, as dict[str, float] is not a
    # `TParameterization`

[docs]
    def evaluate_true(self, params: dict[str, float]) -> torch.Tensor:
        value = sum(elt**2 for elt in params.values())
        return value * torch.ones(self.num_outcomes, dtype=torch.double)





[docs]
def get_jenatton_arm(i: int) -> Arm:
    """
    Args:
        i Non-negative int.
    """
    jenatton_x_params = {f"x{j}": j % (i + 1) for j in range(1, 8)}
    jenatton_r_params = {"r8": 0.0, "r9": 0.0}
    return Arm(parameters={**jenatton_x_params, **jenatton_r_params}, name=f"0_{i}")




[docs]
def get_jenatton_experiment() -> Experiment:
    experiment = Experiment(
        search_space=get_jenatton_search_space(),
        name="test_jenatton",
        is_test=True,
    )
    return experiment




[docs]
def get_jenatton_trials(n_trials: int) -> dict[int, Trial]:
    experiment = get_jenatton_experiment()
    for i in range(n_trials):
        trial = experiment.new_trial()
        trial.add_arm(get_jenatton_arm(i=i))
    # pyre-fixme: Incompatible return type [7]: Expected `Dict[int, Trial]` but
    # got `Dict[int, BaseTrial]`.
    return experiment.trials




[docs]
def get_jenatton_batch_trial() -> BatchTrial:
    experiment = get_jenatton_experiment()
    trial = experiment.new_batch_trial()
    trial.add_arm(get_jenatton_arm(0))
    trial.add_arm(get_jenatton_arm(1))
    return trial




[docs]
class DeterministicGenerationNode(ExternalGenerationNode):
    """
    A GenerationNode that explores a discrete search space with one parameter
    deterministically.
    """

    def __init__(
        self,
        search_space: SearchSpace,
    ) -> None:
        if len(search_space.parameters) != 1:
            raise ValueError(
                "DeterministicGenerationNode only supports search spaces with one "
                "parameter."
            )
        param = list(search_space.parameters.values())[0]
        if not isinstance(param, ChoiceParameter):
            raise ValueError(
                "DeterministicGenerationNode only supports ChoiceParameters."
            )
        super().__init__(name="Deterministic")

        self.param_name: str = param.name
        self.iterator: Iterator[TParamValue] = iter(param.values)


[docs]
    def update_generator_state(self, experiment: Experiment, data: Data) -> None:
        return



[docs]
    def get_next_candidate(
        self, pending_parameters: list[TParameterization]
    ) -> TParameterization:
        return {self.param_name: next(self.iterator)}





[docs]
def get_discrete_search_space(n_values: int = 20) -> SearchSpace:
    return SearchSpace(
        parameters=[
            ChoiceParameter(
                name="x0",
                parameter_type=ParameterType.INT,
                values=list(range(n_values)),
            )
        ]
    )




[docs]
def get_async_benchmark_method(
    early_stopping_strategy: BaseEarlyStoppingStrategy | None = None,
    max_pending_trials: int = 2,
) -> BenchmarkMethod:
    gs = GenerationStrategy(
        nodes=[DeterministicGenerationNode(search_space=get_discrete_search_space())]
    )
    return BenchmarkMethod(
        generation_strategy=gs,
        max_pending_trials=max_pending_trials,
        batch_size=1,
        early_stopping_strategy=early_stopping_strategy,
    )




[docs]
def get_async_benchmark_problem(
    map_data: bool,
    step_runtime_fn: TBenchmarkStepRuntimeFunction | None = None,
    n_steps: int = 1,
    lower_is_better: bool = False,
    report_inference_value_as_trace: bool = False,
    num_objectives: int = 1,
    num_constraints: int = 0,
) -> BenchmarkProblem:
    """
    Create an early-stopping benchmark problem with MAP_KEY data.

    Args:
        map_data: Whether to use map metrics (required for early stopping).
        step_runtime_fn: Optional runtime function for steps.
        n_steps: Number of steps per trial.
        lower_is_better: Whether lower values are better (for SOO).
        report_inference_value_as_trace: Whether to report inference trace.
        num_objectives: Number of objectives (1 for SOO, >1 for MOO).
        num_constraints: Number of outcome constraints to add.

    Returns:
        A BenchmarkProblem suitable for early-stopping evaluation.
    """
    search_space = get_discrete_search_space()

    # Create outcome names for objectives and constraints
    objective_names = [f"objective_{i}" for i in range(num_objectives)]
    constraint_names = [f"constraint_{i}" for i in range(num_constraints)]
    outcome_names = [*objective_names, *constraint_names]

    test_function = IdentityTestFunction(n_steps=n_steps, outcome_names=outcome_names)

    if num_objectives == 1:
        # Single-objective: first outcome is objective, rest are constraints
        optimization_config, opt_config_metrics = get_soo_opt_config(
            outcome_names=outcome_names,
            lower_is_better=lower_is_better,
            observe_noise_sd=True,
            use_map_metric=map_data,
        )
    else:
        # Multi-objective: pass all outcomes (objectives + constraints)
        # get_moo_opt_config will use the last num_constraints as constraints
        optimization_config, opt_config_metrics = get_moo_opt_config(
            outcome_names=outcome_names,
            ref_point=[1.0] * num_objectives,
            num_constraints=num_constraints,
            lower_is_better=lower_is_better,
            observe_noise_sd=True,
            use_map_metric=map_data,
        )

    return BenchmarkProblem(
        name="test",
        search_space=search_space,
        optimization_config=optimization_config,
        test_function=test_function,
        num_trials=4,
        baseline_value=19 if lower_is_better else 0,
        optimal_value=0 if lower_is_better else 19,
        worst_feasible_value=(19 if lower_is_better else 0)
        if num_constraints > 0
        else None,
        step_runtime_function=step_runtime_fn,
        report_inference_value_as_trace=report_inference_value_as_trace,
        opt_config_metrics=opt_config_metrics,
    )




[docs]
def get_benchmark_metric() -> BenchmarkMetric:
    return BenchmarkMetric(name="test", lower_is_better=True)




[docs]
def get_benchmark_map_metric() -> BenchmarkMapMetric:
    return BenchmarkMapMetric(name="test", lower_is_better=True)




[docs]
def get_benchmark_time_varying_metric() -> BenchmarkTimeVaryingMetric:
    return BenchmarkTimeVaryingMetric(name="test", lower_is_better=True)




[docs]
def get_benchmark_map_unavailable_while_running_metric() -> (
    BenchmarkMapUnavailableWhileRunningMetric
):
    return BenchmarkMapUnavailableWhileRunningMetric(name="test", lower_is_better=True)




[docs]
def get_mock_lcbench_data() -> LCBenchData:
    """
    Used for mocking out `load_lcbench_data` to avoid downloading data from the
    internet.
    """
    timestamp_series = pd.Series([0], index=pd.Index([0], name="trial"))
    parameters = get_lcbench_parameters()

    parameter_df = pd.DataFrame(
        {name: [param.lower, param.upper] for name, param in parameters.items()}
    )
    metric_series = pd.Series(
        [0],
        index=pd.MultiIndex.from_tuples([(0, 0)], names=["trial", "epoch"]),
    )

    return LCBenchData(
        parameter_df=parameter_df,
        metric_series=metric_series,
        timestamp_series=timestamp_series,
    )




[docs]
def get_adapter(experiment: Experiment) -> TorchAdapter:
    """Create a generic adapter for testing different surrogate model types."""
    adapter = TorchAdapter(
        experiment=experiment,
        generator=BoTorchGenerator(),
    )
    return adapter




[docs]
def get_saas_adapter(experiment: Experiment) -> TorchAdapter:
    """Create an adapter with SaasFullyBayesianSingleTaskGP model."""
    return TorchAdapter(
        experiment=experiment,
        generator=BoTorchGenerator(
            surrogate_spec=SurrogateSpec(
                model_configs=[
                    ModelConfig(
                        botorch_model_class=SaasFullyBayesianSingleTaskGP,
                        mll_options={
                            "warmup_steps": 2,
                            "num_samples": 4,
                            "thinning": 1,
                        },
                    ),
                ]
            ),
        ),
    )