Что получится в результате
Установим Llama на Windows через Ollama. Это самый короткий путь для первого локального запуска: без сборки llama.cpp, без ручного скачивания весов и без настройки Python. После инструкции у вас будет локальная модель, которая отвечает в PowerShell и доступна через API на `localhost:11434`.
В результате будет готово:
- Windows проверена на совместимость;
- Ollama установлена через официальный Windows installer;
- команда `ollama` работает в PowerShell;
- локальный сервис отвечает на `localhost:11434`;
- модель `llama3.2:3b` скачана и запущена;
- для слабого ПК есть вариант `llama3.2:1b`;
- список моделей проверяется через `ollama list`;
- активные запуски проверяются через `ollama ps`;
- API проверен через `Invoke-RestMethod`;
- место хранения моделей можно перенести через `OLLAMA_MODELS`;
- лишние модели можно удалить через `ollama rm`;
- есть checklist типовых ошибок.
Финальная проверка: в PowerShell команда `ollama run llama3.2:3b` открывает чат, модель отвечает на русском, а локальный API возвращает JSON-ответ на тестовый запрос.
Что понадобится
Подготовьте:
- Windows 10 или Windows 11;
- права на установку программы;
- 8 ГБ RAM минимум для маленьких моделей;
- 16 ГБ RAM лучше для комфортного запуска 3B-8B моделей;
- 5-10 ГБ свободного места для первой модели;
- стабильный интернет для скачивания модели;
- PowerShell;
- официальный сайт Ollama;
- необязательная видеокарта NVIDIA или AMD;
- понимание, что локальная модель не равна ChatGPT по скорости и качеству.
Если компьютер слабый, начинайте с `llama3.2:1b`. Если RAM 16 ГБ и выше, пробуйте `llama3.2:3b`. Большие модели ставьте только после проверки маленькой.
Шаг 1. Определите, что именно устанавливаем
Важно разделить понятия:
- Llama - семейство языковых моделей Meta;
- Ollama - программа, которая скачивает и запускает модели локально;
- PowerShell - терминал, из которого вы будете запускать команды;
- локальный API - адрес `http://localhost:11434`, через который программы могут обращаться к модели;
- модельный тег - имя модели, например `llama3.2:3b`.
Для этой инструкции используем связку:
Windows -> Ollama -> llama3.2:3b -> PowerShell -> localhost:11434
Проверка: вы устанавливаете не “приложение Llama”, а Ollama, внутри которой запускается модель Llama.
Шаг 2. Проверьте Windows и железо
Откройте PowerShell и посмотрите базовую информацию:
systeminfo | Select-String "OS Name","OS Version","Total Physical Memory"
Проверьте место на диске:
Get-PSDrive C
Ориентир:
- `llama3.2:1b` - для слабых машин и быстрых тестов;
- `llama3.2:3b` - нормальный первый вариант;
- 7B-8B модели - лучше иметь 16 ГБ RAM или больше;
- 13B и выше - не начинайте с них на обычном ноутбуке;
- если диска меньше 10 ГБ, сначала освободите место.
Проверка: вы понимаете, какую модель скачивать первой, и не начинаете с тяжелого варианта.
Шаг 3. Обновите драйвер видеокарты
Если есть дискретная видеокарта, обновите драйвер до свежей версии.
Сделайте:
- откройте сайт NVIDIA, AMD или Intel;
- скачайте драйвер под вашу видеокарту;
- установите драйвер;
- перезагрузите Windows;
- не ставьте сомнительные driver-pack утилиты;
- если видеокарты нет, пропустите шаг.
Проверка NVIDIA:
nvidia-smi
Если команда не найдена, это не блокер для CPU-запуска. Ollama все равно может работать на процессоре, просто медленнее.
Шаг 4. Скачайте Ollama для Windows
Откройте официальный сайт:
https://ollama.com/download/windows
Сделайте:
- нажмите Download for Windows;
- скачайте installer;
- проверьте, что файл скачан с домена `ollama.com`;
- закройте старые окна PowerShell;
- запустите installer;
- дождитесь завершения установки;
- если Windows спросит разрешение, подтвердите установку.
Проверка: Ollama появилась в системе, но старые окна PowerShell могут еще не видеть команду.
Шаг 5. Откройте новый PowerShell
После установки откройте новое окно PowerShell.
Проверьте команду:
ollama --version
Ожидаемый результат:
ollama version ...
Если видите ошибку `ollama не распознается`, сделайте:
- закройте PowerShell;
- откройте PowerShell заново;
- если не помогло, перезагрузите Windows;
- проверьте, что Ollama установлена;
- не скачивайте случайные exe-файлы с форумов.
Проверка: команда `ollama --version` возвращает версию.
Шаг 6. Проверьте локальный сервис Ollama
Ollama поднимает локальный API.
Проверьте:
(Invoke-WebRequest http://localhost:11434).Content
Ожидаемый ответ:
Ollama is running
Если ответа нет:
- запустите Ollama из меню Пуск;
- подождите 10-20 секунд;
- повторите команду;
- проверьте firewall;
- перезагрузите компьютер.
Проверка: `localhost:11434` отвечает.
Шаг 7. Скачайте маленькую модель для первого теста
Начните с маленькой модели. Так проще отделить проблему установки от нехватки ресурсов.
Команда:
ollama run llama3.2:1b
Что произойдет:
- Ollama проверит, есть ли модель локально;
- если модели нет, скачает ее;
- после скачивания откроет интерактивный чат;
- курсор будет ждать ваш вопрос;
- модель начнет отвечать локально.
Тестовый вопрос:
Объясни в 3 предложениях, что такое локальная LLM.
Проверка: модель отвечает в PowerShell.
Шаг 8. Запустите основной вариант Llama
Если маленькая модель работает, попробуйте `llama3.2:3b`.
Команда:
ollama run llama3.2:3b
Тестовый запрос:
Составь короткий план статьи про ИИ-агентов для малого бизнеса.
Если модель отвечает слишком медленно:
- остановите чат сочетанием `Ctrl+C`;
- вернитесь к `llama3.2:1b`;
- закройте тяжелые программы;
- проверьте RAM;
- не ставьте 8B модель, пока 3B работает плохо.
Проверка: `llama3.2:3b` запускается и дает связный ответ.
Шаг 9. Выйдите из интерактивного чата
Когда чат открыт, можно завершить его.
Варианты:
- нажмите `Ctrl+C`;
- введите `/bye`, если команда доступна в вашей версии;
- закройте окно PowerShell;
- не удаляйте модель, если она нужна дальше.
После выхода проверьте активные модели:
ollama ps
Проверка: вы понимаете, какая модель сейчас загружена.
Шаг 10. Посмотрите список скачанных моделей
Команда:
ollama list
Ожидаемый формат:
NAME ID SIZE MODIFIED
llama3.2:3b ... ... ...
Используйте `ollama list`, чтобы:
- проверить, что модель скачалась;
- увидеть размер;
- понять, какие модели занимают диск;
- не скачивать одно и то же несколько раз;
- выбрать точное имя для API.
Проверка: в списке есть `llama3.2:1b` или `llama3.2:3b`.
Шаг 11. Проверьте API через PowerShell
Теперь проверьте локальный API.
Команда:
$body = @{
model = "llama3.2:3b"
prompt = "Ответь одним предложением: что такое RAG?"
stream = $false
} | ConvertTo-Json
Invoke-RestMethod `
-Uri "http://localhost:11434/api/generate" `
-Method Post `
-ContentType "application/json" `
-Body $body
Если используете маленькую модель, замените:
model = "llama3.2:1b"
Проверка: PowerShell возвращает объект с полем `response`.
Шаг 12. Сделайте короткий API-тест одной строкой
Для быстрой проверки удобно иметь короткую команду.
Invoke-RestMethod -Uri "http://localhost:11434/api/generate" -Method Post -ContentType "application/json" -Body '{"model":"llama3.2:3b","prompt":"Напиши одно слово: работает","stream":false}'
Ожидаемо в ответе должно быть что-то вроде:
response : работает
Проверка: API работает без интерактивного чата.
Шаг 13. Проверьте чатовый API
Некоторые приложения используют chat endpoint.
Команда:
$body = @{
model = "llama3.2:3b"
messages = @(
@{
role = "user"
content = "Дай 3 идеи, как использовать локальную Llama дома"
}
)
stream = $false
} | ConvertTo-Json -Depth 5
Invoke-RestMethod `
-Uri "http://localhost:11434/api/chat" `
-Method Post `
-ContentType "application/json" `
-Body $body
Проверка: в ответе есть `message.content`.
Шаг 14. Создайте рабочую папку для тестов
Создайте папку:
mkdir C:\AI\llama-tests
cd C:\AI\llama-tests
Создайте файл `test-prompts.txt`:
@"
1. Объясни RAG простыми словами.
2. Составь план письма клиенту.
3. Сделай краткий конспект текста.
4. Напиши список рисков локальной LLM.
"@ | Out-File -Encoding utf8 .\test-prompts.txt
Проверка: тестовые запросы лежат в отдельной папке, а не теряются в истории PowerShell.
Шаг 15. Проверьте скорость ответа
Сделайте простой замер:
Measure-Command {
Invoke-RestMethod -Uri "http://localhost:11434/api/generate" -Method Post -ContentType "application/json" -Body '{"model":"llama3.2:3b","prompt":"Скажи коротко, зачем нужен локальный AI","stream":false}'
}
Оценка:
- до 10 секунд - комфортно для коротких задач;
- 10-30 секунд - терпимо для экспериментов;
- больше 30 секунд - модель тяжеловата;
- если Windows начинает зависать, берите меньшую модель;
- если ноутбук сильно греется, не держите длинные генерации постоянно.
Проверка: вы знаете реальную скорость на своем компьютере.
Шаг 16. Освободите память после теста
Если модель остается загруженной, остановите ее.
ollama ps
ollama stop llama3.2:3b
Если запускали 1B:
ollama stop llama3.2:1b
Проверка: `ollama ps` не показывает лишнюю активную модель.
Шаг 17. Удалите ненужную модель
Модели занимают место на диске.
Посмотреть:
ollama list
Удалить:
ollama rm llama3.2:1b
Не удаляйте модель, если:
- она нужна для локального API;
- ее использует Open WebUI;
- ее использует редактор кода;
- вы не уверены, какая модель сейчас основная.
Проверка: после `ollama rm` модель исчезает из `ollama list`.
Шаг 18. Перенесите папку моделей на другой диск
Если диск C переполняется, перенесите модели через переменную `OLLAMA_MODELS`.
Создайте папку:
mkdir D:\OllamaModels
Откройте переменные среды Windows:
- нажмите Win;
- найдите “Изменение системных переменных среды”;
- откройте “Переменные среды”;
- создайте переменную пользователя `OLLAMA_MODELS`;
- значение: `D:\OllamaModels`;
- сохраните;
- перезапустите Ollama;
- откройте новый PowerShell.
После этого новые модели будут скачиваться в указанную папку.
Проверка: скачайте маленькую модель и убедитесь, что файлы появляются на диске D.
Шаг 19. Настройте автозапуск аккуратно
Ollama обычно работает как локальное приложение или фоновый сервис.
Проверьте:
- после перезагрузки команда `ollama --version` работает;
- `localhost:11434` отвечает;
- приложение Ollama есть в автозагрузке, если вам это нужно;
- если не нужно, отключите автозапуск в настройках Windows;
- не запускайте несколько копий Ollama вручную.
Проверка:
(Invoke-WebRequest http://localhost:11434).Content
Шаг 20. Подключите простой веб-интерфейс только после проверки
Сначала убедитесь, что PowerShell и API работают. Потом можно ставить интерфейс.
Варианты:
- Open WebUI - веб-интерфейс для Ollama и других провайдеров;
- AnythingLLM - интерфейс для чатов и документов;
- LM Studio - отдельный desktop-вариант для локальных моделей;
- собственный небольшой frontend через API;
- редактор кода с поддержкой Ollama.
Не начинайте с интерфейса, если сама команда `ollama run` еще не работает.
Проверка: локальный API отвечает, а потом уже подключается UI.
Шаг 21. Проверьте русский язык
Запустите модель:
ollama run llama3.2:3b
Попросите:
Напиши короткую инструкцию на русском: как безопасно пользоваться локальной LLM.
Оцените:
- отвечает ли модель на русском;
- не смешивает ли языки;
- не уходит ли в слишком длинный ответ;
- понимает ли контекст;
- не выдумывает ли команды Windows.
Проверка: для русских задач качество приемлемое именно на вашей машине и модели.
Шаг 22. Настройте базовый prompt для работы
Для бытового использования держите короткий системный шаблон.
Отвечай на русском.
Если не знаешь, скажи прямо.
Не выдумывай команды и пути файлов.
Давай пошаговые инструкции.
Для опасных действий сначала предупреждай о рисках.
Можно использовать его в чат-интерфейсе или вставлять в начало запроса.
Проверка: ответы становятся короче и предсказуемее.
Шаг 23. Проверьте приватность локального запуска
Локальная модель удобна для приватных экспериментов, но это не магическая безопасность.
Правила:
- не вставляйте пароли;
- не вставляйте банковские данные;
- не вставляйте персональные данные клиентов;
- не открывайте порт `11434` в интернет;
- не пробрасывайте Ollama через роутер;
- не ставьте неизвестные модели из сомнительных источников;
- обновляйте Ollama;
- удаляйте ненужные модели.
Проверка:
netstat -ano | Select-String "11434"
Адрес должен быть локальным. Если вы специально открываете доступ по сети, добавляйте авторизацию и firewall.
Шаг 24. Добавьте модель в локальный скрипт
Создайте файл `ask-llama.ps1`:
param(
[string]$Prompt = "Объясни, что такое ИИ-агент"
)
$body = @{
model = "llama3.2:3b"
prompt = $Prompt
stream = $false
} | ConvertTo-Json
$result = Invoke-RestMethod `
-Uri "http://localhost:11434/api/generate" `
-Method Post `
-ContentType "application/json" `
-Body $body
$result.response
Запуск:
.\ask-llama.ps1 -Prompt "Составь план дня из 5 пунктов"
Проверка: скрипт возвращает только текст ответа.
Шаг 25. Сделайте таблицу тестов
Создайте `llama_windows_test_cases`.
id
command
expected_result
status
comment
Заполните:
- `T001` - `ollama --version` - показывает версию;
- `T002` - `localhost:11434` - отвечает `Ollama is running`;
- `T003` - `ollama run llama3.2:1b` - модель отвечает;
- `T004` - `ollama run llama3.2:3b` - модель отвечает;
- `T005` - `ollama list` - модель есть в списке;
- `T006` - `/api/generate` - возвращает `response`;
- `T007` - `/api/chat` - возвращает `message.content`;
- `T008` - `ollama ps` - показывает активную модель;
- `T009` - `ollama stop` - модель остановлена;
- `T010` - русский prompt - ответ на русском.
Проверка: установка считается завершенной только после прохождения тестов, а не после скачивания installer.
Шаг 26. Разберите ошибку “команда ollama не найдена”
Если PowerShell пишет, что `ollama` не распознается:
- закройте PowerShell;
- откройте новое окно;
- перезагрузите Windows;
- проверьте, что Ollama установлена;
- откройте меню Пуск и запустите Ollama;
- проверьте переменную PATH;
- переустановите Ollama с официального сайта.
Проверка:
Get-Command ollama
Команда должна показать путь к исполняемому файлу.
Шаг 27. Разберите ошибку “localhost:11434 не отвечает”
Если API не отвечает:
- запустите Ollama из меню Пуск;
- проверьте значок Ollama в трее;
- подождите 10-20 секунд;
- проверьте firewall;
- перезагрузите Windows;
- проверьте, не занят ли порт другим процессом;
- переустановите Ollama, если сервис не стартует.
Проверка:
Test-NetConnection localhost -Port 11434
`TcpTestSucceeded` должен быть `True`.
Шаг 28. Разберите нехватку памяти и медленную генерацию
Если модель тормозит или Windows зависает:
- остановите генерацию через `Ctrl+C`;
- закройте браузер, игры, IDE и тяжелые приложения;
- используйте `llama3.2:1b`;
- не запускайте несколько моделей одновременно;
- проверьте `ollama ps`;
- освободите RAM;
- попробуйте более маленькую модель;
- не ставьте 8B-13B модели на слабый ноутбук.
Проверка:
ollama ps
В списке не должно быть лишних активных моделей.
Шаг 29. Подготовьте рабочий checklist
Перед тем как пользоваться Llama каждый день, проверьте:
- `ollama --version` работает;
- `localhost:11434` отвечает;
- модель есть в `ollama list`;
- модель отвечает в PowerShell;
- API возвращает `response`;
- `ollama ps` показывает активные модели;
- вы знаете, как остановить модель;
- вы знаете, как удалить модель;
- диск не переполнен;
- порт 11434 не открыт наружу;
- вы не вставляете секреты в prompt;
- есть тестовый файл с командами.
Проверка: если любой пункт не выполнен, исправьте его до подключения UI или внешних программ.
Шаг 30. Минимальная проверка результата
Прогоните финальный сценарий.
Команда 1:
ollama --version
Должно быть:
- команда найдена;
- версия показана;
- ошибок PATH нет.
Команда 2:
ollama run llama3.2:3b
Должно быть:
- модель скачивается или запускается;
- чат открывается;
- модель отвечает на русском;
- PowerShell не зависает.
Команда 3:
Invoke-RestMethod -Uri "http://localhost:11434/api/generate" -Method Post -ContentType "application/json" -Body '{"model":"llama3.2:3b","prompt":"Ответь одним словом: работает","stream":false}'
Должно быть:
- есть поле `response`;
- ответ относится к запросу;
- ошибок подключения нет.
Если эти три проверки проходят, Llama на Windows установлена и готова к локальным задачам.
Что нельзя автоматизировать в первой версии
Не делайте сразу:
- открытие `localhost:11434` в интернет;
- запуск локальной модели как публичного API без авторизации;
- обработку персональных данных клиентов;
- автоматическое выполнение команд Windows по ответам модели;
- доступ модели к файлам без ограничений;
- подключение к production CRM;
- финансовые операции;
- удаление файлов по совету модели;
- хранение паролей в prompt;
- использование неизвестных моделей из случайных архивов;
- длительные фоновые генерации на ноутбуке без контроля температуры;
- одновременный запуск нескольких тяжелых моделей.
Первая версия должна уметь только отвечать в PowerShell и через локальный API. Интерфейсы, документы, RAG и агенты добавляйте после базовой проверки.
Частые вопросы
Можно ли установить Llama на Windows без видеокарты?
Да. Ollama может запускать модели на CPU, но скорость будет ниже. Для первого теста берите `llama3.2:1b`, затем пробуйте `llama3.2:3b`.
Что лучше поставить первым: 1B, 3B или 8B?
Начните с `llama3.2:1b`, чтобы проверить установку. Если все работает, переходите на `llama3.2:3b`. 8B и больше ставьте только если хватает RAM и вас устраивает скорость.
Нужно ли платить за Ollama?
Для локального запуска Ollama обычно используют бесплатно. Расходы появляются на железо, электричество, хранение моделей или облачные сервисы, если вы их отдельно подключаете.
Где хранятся скачанные модели?
Управляйте моделями через `ollama list`, `ollama rm` и переменную `OLLAMA_MODELS`. Если диск C заканчивается, задайте `OLLAMA_MODELS`, например `D:\OllamaModels`, и перезапустите Ollama.
Можно ли подключить Llama к своему приложению?
Да. После установки Ollama дает локальный API на `http://localhost:11434`. Для генерации используйте `/api/generate`, для чата - `/api/chat`. Не открывайте этот API в интернет без авторизации.