Natalie Ma fysicallyphit

🎯

Focusing

ML researcher in LLM inference efficiency and compression. Founder @ Entropy

Pinned Loading

kv-cache-compression kv-cache-compression Public

Compression of KV cache using Singular Value Decomposition and 4-bit quantization

Python
llmlingua2 llmlingua2 Public

My contributions to LLMLingua-2 prompt compression: Domain-awareness, soft scoring, and round trip reconstruction.

Python 1
qosmic-audit qosmic-audit Public

Building an agent to optimize e-commerce consumer conversion + auto improvement.

Python
AI-coding-workflow AI-coding-workflow Public

The most efficient way to implement agentic coding into your stack.