Термин

Ollama

Runtime и CLI для локального запуска Llama и других языковых моделей.

Ollama помогает скачать модель, запустить ее командой ollama run, посмотреть список через ollama list, остановить через ollama stop и обращаться к модели через локальный API localhost:11434.