cortex

helexa/cortex

Fork 0

Files

History

rob thijssen bef159b21c

build-prerelease / Resolve version stamps (push) Successful in 37s

Details

build-prerelease / Build cortex binary (push) Successful in 4m36s

Details

build-prerelease / Build neuron-blackwell (push) Successful in 3m31s

Details

build-prerelease / Package cortex RPM (push) Successful in 1m27s

Details

CI / Format (push) Waiting to run

Details

CI / Clippy (push) Waiting to run

Details

CI / Test (push) Waiting to run

Details

build-prerelease / Build neuron-ada (push) Has been cancelled

Details

build-prerelease / Package helexa-neuron-ada RPM (push) Has been cancelled

Details

build-prerelease / Package helexa-neuron-ampere RPM (push) Has been cancelled

Details

build-prerelease / Package helexa-neuron-blackwell RPM (push) Has been cancelled

Details

build-prerelease / Publish to rpm.lair.cafe (unstable) (push) Has been cancelled

Details

CI / Build cortex SRPM (push) Has been cancelled

Details

CI / Build neuron SRPM (push) Has been cancelled

Details

CI / Publish cortex to COPR (push) Has been cancelled

Details

CI / Publish neuron to COPR (push) Has been cancelled

Details

CI / Bump version in source (push) Has been cancelled

Details

build-prerelease / Build neuron-ampere (push) Has been cancelled

Details

feat(stage-8e-1): MaybeQuantLinear primitive + parallel-linear quant variants

Introduces MaybeQuantLinear, which wraps either a plain candle Linear
or a candle QMatMul backed by a freshly-quantized QTensor. Forward
dispatches identically through the Module trait so downstream code
doesn't care which arm is active.

ColumnParallelLinear and RowParallelLinear gain `load_with_quant`
methods. The existing `load` methods stay as backward-compatible
no-quantization wrappers — no churn at the 27 existing call sites.

This is the foundation for in-situ quantization at load time. Wiring
the user-facing quant config and switching call sites to
load_with_quant follow in stages 8e-2 / 8e-3.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-05-21 17:55:26 +03:00

cuda

feat(stage-8d-1): import mistralrs GDN CUDA kernels — build infra only

2026-05-21 11:34:11 +03:00

harness

feat(stage-8e-1): MaybeQuantLinear primitive + parallel-linear quant variants

2026-05-21 17:55:26 +03:00

api.rs

chore(neuron): log load_model failures server-side with full chain

2026-05-19 13:08:54 +03:00

config.rs

feat(neuron): load default_models on service activation