ollama/x/create/client/quantize_test.go

package client

import (
	"testing"

	"github.com/ollama/ollama/x/mlxrunner/mlx"
)

func TestDecodeSourceFP8TensorAcceptsWeightScale(t *testing.T) {
	if err := mlx.CheckInit(); err != nil {
		t.Skipf("MLX unavailable: %v", err)
	}

	weight := mlx.FromValues([]uint8{0, 1, 2, 3}, 2, 2)
	scale := mlx.FromValues([]float32{1}, 1, 1).AsType(mlx.DTypeBFloat16)
	got, err := decodeSourceFP8Tensor(weight, scale)
	if err != nil {
		t.Fatal(err)
	}
	mlx.Eval(got)
	if dims := got.Dims(); len(dims) != 2 || dims[0] != 2 || dims[1] != 2 {
		t.Fatalf("decoded dims = %v, want [2 2]", dims)
	}
}