turboquant-mlx-full

PyPI page
Home page
Author: None
Summary: Extreme weight and KV cache compression for LLMs on Apple Silicon (MLX implementation of Google's TurboQuant)
Latest version: 0.12.4
Required dependencies: mlx | mlx-lm | numpy | transformers
Optional dependencies: build | datasets | mlx-vlm | pytest | transformers | twine

Downloads last day: 32
Downloads last week: 490
Downloads last month: 1,256