Термин
Ollama
Runtime и CLI для локального запуска Llama и других языковых моделей.
Ollama помогает скачать модель, запустить ее командой ollama run, посмотреть список через ollama list, остановить через ollama stop и обращаться к модели через локальный API localhost:11434.