Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference - Cerebras - discu.eu

Hacker News

Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference https://cerebras.ai/blog/llama-405b-inference 156 comments 19/11/2024

Linking pages

Related searches:

Search whole site: site:cerebras.ai

Search title: Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference - Cerebras

See how to search.

Submit link to: