Scoring¶

Proper scoring rules for posterior predictive evaluation.

`trade_study.score(metric, predictions, truth, *, alpha=None, level=0.95)` ¶

Compute a scalar scoring rule.

Parameters:

Name	Type	Description	Default
`metric`	`str`	One of "crps", "wis", "interval", "energy", "rmse", "mae", "coverage", "brier".	required
`predictions`	`NDArray[floating[Any]]`	Model predictions (ensemble members, quantiles, etc.).	required
`truth`	`NDArray[floating[Any]]`	Known ground truth values.	required
`alpha`	`float \| NDArray[floating[Any]] \| None`	Significance level for interval-based scores.	`None`
`level`	`float`	Nominal coverage level for coverage metric.	`0.95`

Returns:

Type	Description
`float`	Scalar score value.

Raises:

Type	Description
`ValueError`	If the metric name is not recognized.

Source code in src/trade_study/_scoring.py

def score(
    metric: str,
    predictions: NDArray[np.floating[Any]],
    truth: NDArray[np.floating[Any]],
    *,
    alpha: float | NDArray[np.floating[Any]] | None = None,
    level: float = 0.95,
) -> float:
    """Compute a scalar scoring rule.

    Args:
        metric: One of "crps", "wis", "interval", "energy",
            "rmse", "mae", "coverage", "brier".
        predictions: Model predictions (ensemble members, quantiles, etc.).
        truth: Known ground truth values.
        alpha: Significance level for interval-based scores.
        level: Nominal coverage level for coverage metric.

    Returns:
        Scalar score value.

    Raises:
        ValueError: If the metric name is not recognized.
    """
    simple = {
        "crps": _crps,
        "energy": _energy,
        "brier": _brier,
        "rmse": _rmse,
        "mae": _mae,
    }
    if metric in simple:
        return simple[metric](predictions, truth)
    if metric == "wis":
        return _wis(predictions, truth, alpha=alpha)
    if metric == "interval":
        return _interval(predictions, truth, alpha=alpha)
    if metric == "coverage":
        return _coverage(predictions, truth, level=level)
    msg = f"Unknown metric: {metric!r}"
    raise ValueError(msg)

`trade_study.coverage_curve(posteriors, truth, levels=None)` ¶

Compute empirical coverage across nominal levels.