Ollama可配置环境变量: OLLAMA_DEBUG: 显示额外的调试信息(例如:OLLAMA_DEBUG=1)。 OLLAMA_HOST: Ollama 服务器的 IP 地址(默认值:127.0.0.1:11434)。 OLLAMA_KEEP_ALIVE: 模型在内存中保持加载的时长(默认值:“5m”)。 OLLAMA_MAX_LOADED_MODELS: 每个 GPU 上最大加载模型数量。 OLLAMA_MAX_QUEUE: 请求队列的最大长度。 OLLAMA_MODELS: