gradio和vllm的结合问题 #331

Haoran1234567 · 2024-04-29T02:12:38Z

您好，感谢社区给出的很好的示例。我看到gradio和vllm分布式加速推理是放到了两个地方来示例。如果我想要用gradio来充当大模型的访问界面，同时我还想要用vllm来给部署的大模型加速，这个问题该如何解决？我想到的方法是分别启动两个服务，然后从gradio服务里边去调用vllm服务的api作为处理函数，我这样做对吗，两者结合的标准范式是什么呢

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

gradio和vllm的结合问题 #331

gradio和vllm的结合问题 #331

Haoran1234567 commented Apr 29, 2024

gradio和vllm的结合问题 #331

gradio和vllm的结合问题 #331

Comments

Haoran1234567 commented Apr 29, 2024