serving-dinov2

Serving dinov2 onnx model with triton. (Artifact throughput: 48.927 infer/sec)
Gradio Demo.
Docker Compose.
K8s Setting(Triton, Traefik, Promtail, Loki, Prometheus, Grafana).
Serving dinov2 TensorRT Model. (Artifact throughput: 222.66 infer/sec)
~~Serving dinov2 onnx model with Fastertransformer~~ (fastertransformer_backend don't support vit yet.)

Docker Compose

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
charts		charts
docs		docs
secrets		secrets
src		src
Makefile		Makefile
README.md		README.md
docker-compose.yml		docker-compose.yml