Inference #vLLMAIBrixSGLangText Generation Inference(TGI)LlamaEdgeChitu(赤兔) - 是一个专注于效率、灵活性和可用性的高性能大语言模型推理框架mlx-lm - 在搭载Apple芯片的设备上使用MLX框架生成文本和微调大型语言模型。