cortex

helexa/cortex

Fork 0

Files

History

rob thijssen cc95fe28d9

build-prerelease / Resolve version stamps (push) Successful in 1m45s

Details

build-prerelease / Build neuron-blackwell (push) Successful in 3m40s

Details

build-prerelease / Build cortex binary (push) Successful in 4m27s

Details

build-prerelease / Package cortex RPM (push) Successful in 1m24s

Details

build-prerelease / Build neuron-ampere (push) Successful in 5m30s

Details

build-prerelease / Build neuron-ada (push) Successful in 5m24s

Details

build-prerelease / Package helexa-neuron-ada RPM (push) Successful in 3m6s

Details

build-prerelease / Package helexa-neuron-ampere RPM (push) Successful in 3m6s

Details

build-prerelease / Package helexa-neuron-blackwell RPM (push) Successful in 3m49s

Details

CI / Format (push) Successful in 35s

Details

build-prerelease / Publish to rpm.lair.cafe (unstable) (push) Successful in 1m7s

Details

CI / Clippy (push) Successful in 2m16s

Details

CI / Test (push) Successful in 4m37s

Details

CI / Build cortex SRPM (push) Has been skipped

Details

CI / Build neuron SRPM (push) Has been skipped

Details

CI / Publish cortex to COPR (push) Has been skipped

Details

CI / Publish neuron to COPR (push) Has been skipped

Details

CI / Bump version in source (push) Has been skipped

Details

feat(stage-8d-5b): wire fused_gdn_gating CUDA kernel

run_fused_gating helper consolidates the per-layer gating math:
  beta = sigmoid(b)
  g    = -exp(a_log) * softplus(a + dt_bias)

CUDA path issues a single launch via fused_gdn_gating_cuda;
cpu path falls back to the original per-op Rust sequence. Replaces
~10 candle launches per linear-attention layer (sigmoid + 2× to_dtype
+ exp + neg + broadcast_add + softplus + 2× unsqueeze + broadcast_mul)
across both single-GPU and TP forward paths.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-05-21 11:52:38 +03:00

src

feat(stage-8d-5b): wire fused_gdn_gating CUDA kernel

2026-05-21 11:52:38 +03:00

tests

Stage 7a-ii: real NCCL handshake behind the worker pool

2026-05-19 16:40:01 +03:00

build.rs

feat(stage-8d-1): import mistralrs GDN CUDA kernels — build infra only

2026-05-21 11:34:11 +03:00

Cargo.toml

feat(stage-8d-1): import mistralrs GDN CUDA kernels — build infra only

2026-05-21 11:34:11 +03:00