tqai

PyPI page
Home page
Author: pbertsch
Summary: TurboQuant KV cache compression for local LLM inference
Latest version: 0.6.1
Required dependencies: numpy
Optional dependencies: cma | mlx | mlx-lm | pytest | pytest-cov | ruff | scipy | torch | transformers | triton

Downloads last day: 2
Downloads last week: 24
Downloads last month: 238