GitHub - ELS-RD/transformer-deploy: Efficient, scalable and enterprise-grade CPU/GPU inference server for 🤗 Hugging Face transformer models 🚀 - discu.eu

Reddit

[P] What we learned by accelerating by 5X Hugging Face generative language models https://github.com/ELS-RD/transformer-deploy/ 17 comments 9/2/2022 machinelearning

[P] 4.5 times faster Hugging Face transformer inference by modifying some Python AST https://github.com/ELS-RD/transformer-deploy 33 comments 29/12/2021 machinelearning
[P] Python library to optimize Hugging Face transformer for inference: < 0.5 ms latency / 2850 infer/sec https://github.com/ELS-RD/transformer-deploy 19 comments 24/11/2021 machinelearning

Linking pages

Linked pages

Related searches:

Search whole site: site:github.com

Search title: GitHub - ELS-RD/transformer-deploy: Efficient, scalable and enterprise-grade CPU/GPU inference server for 🤗 Hugging Face transformer models 🚀

See how to search.

Submit link to: