Для обычной компании это касается CRM, документов, переписок, звонков, логов, счетов, договоров и аналитики. Для AI-агентов добавляются новые слои: история диалога, память пользователя, embeddings, trace выполнения, результаты tool calls и данные, отправленные во внешние модели.
Хорошая retention-политика не хранит все навсегда. Одни данные нужны несколько дней, другие - месяцы, третьи - годы из-за бухгалтерии, договора или требований безопасности. Часть данных можно обезличивать, часть архивировать, часть удалять автоматически.
В AI-системах особенно важно отделять рабочую память от долговременного хранения. Агент может помнить контекст текущей сессии, но это не значит, что все сообщения нужно навечно сохранять в базе знаний или логах.
Если data retention не описан, риски быстро растут: персональные данные лежат без срока, старые документы попадают в RAG, логи содержат токены и секреты, а пользователь не может понять, что с его данными произошло.
Примеры
- История чата хранится 30 дней, а затем удаляется или обезличивается.
- Логи tool calls хранятся 90 дней для расследования ошибок, но секреты и токены в них маскируются сразу.
- Договоры и закрывающие документы хранятся несколько лет, потому что нужны для бухгалтерии и юридических проверок.
- Embeddings в векторной базе пересоздаются при удалении документа, чтобы старый контент не продолжал отвечать через RAG.
- CRM хранит заявки и сделки, но не сохраняет лишние персональные данные, которые не нужны для обработки обращения.
- Агент поддержки хранит краткую сводку диалога, а полную переписку удаляет после истечения срока retention.
Где используется
- правила хранения истории диалогов AI-агента
- TTL памяти пользователя
- удаление документов из RAG и vector DB
- хранение логов и agent trace
- архивация CRM-данных
- управление персональными данными
- обезличивание старых записей
- подготовка к аудиту безопасности
- сроки хранения договоров и счетов
- удаление данных по запросу пользователя
Связанные термины
Частые вопросы
Зачем AI-агенту data retention?
Чтобы агент не хранил лишнее, не использовал устаревшие данные и мог удалить память, документы, логи или embeddings по понятным правилам.
Что нужно описать в retention policy?
Типы данных, цель хранения, срок, место хранения, доступы, правила архивирования, удаление, обезличивание и ответственных за контроль.
Можно ли хранить историю чатов навсегда?
Технически можно, но обычно это плохая практика. Нужно хранить только то, что нужно для сервиса, безопасности, аналитики или юридических обязанностей.
Что делать с embeddings при удалении документа?
Нужно удалить или пересоздать связанные chunks и embeddings. Иначе документ может исчезнуть из файлов, но продолжить влиять на ответы RAG.
Чем retention отличается от backup?
Retention описывает, сколько и зачем хранить данные. Backup - это резервная копия для восстановления. У backup тоже должны быть сроки хранения и правила удаления.
Какая частая ошибка в data retention?
Хранить все логи и сообщения без фильтра. В логах могут оказаться персональные данные, токены, коммерческая тайна и устаревший контекст.