К PII обычно относят ФИО, email, телефон, адрес, паспортные данные, номер договора, банковские реквизиты, IP-адрес, ID клиента, аккаунт в системе, геолокацию, фото, голосовую запись и другие идентификаторы. В бизнес-системах PII часто встречается в CRM, тикетах поддержки, документах, счетах, звонках, email и базах знаний.
Для ИИ-агентов PII важно учитывать заранее. Агент может читать документы, обрабатывать письма, суммировать звонки, искать по CRM, писать ответы клиентам, вызывать API и сохранять trace. Если персональные данные без контроля попадают в промпты, логи, evals или внешние инструменты, риск утечки быстро растет.
Работа с PII строится по принципу минимизации: агент должен получать только те персональные данные, которые действительно нужны для задачи. Все лишнее лучше маскировать, редактировать или не передавать в модель. Для production-сценариев PII нужно защищать через access control, PII masking, redaction, data retention, policy gate, audit log и проверки на sensitive data disclosure.
Примеры
- Email клиента, номер телефона и ФИО в обращении поддержки являются PII.
- Номер договора сам по себе может быть PII, если по нему можно найти конкретного клиента.
- Запись звонка содержит голос, имя, номер телефона и детали обращения, поэтому требует аккуратной обработки.
- В CRM-карточке лида есть должность, компания, email и история общения — это набор персональных данных.
- Перед отправкой тикета в модель агент заменяет email на [EMAIL], а телефон на [PHONE].
Где используется
- Определять, какие поля в CRM, тикетах, документах и логах являются персональными данными.
- Решать, какие данные можно передавать ИИ-агенту, а какие нужно маскировать.
- Настраивать PII masking и redaction перед отправкой текста в модель.
- Защищать agent trace, логи, evals и datasets от лишних персональных данных.
- Ограничивать доступ к PII через ACL, роли и policy gate.
- Проверять ответы агента на sensitive data disclosure.
- Настраивать data retention: сколько хранить обращения, логи и результаты обработки.
- Обучать команду распознавать прямые и косвенные идентификаторы.
- Снижать риски при RAG, tool calling, обработке документов и звонков.
Связанные термины
Частые вопросы
Что такое PII простыми словами?
PII — это данные, по которым можно узнать конкретного человека: имя, email, телефон, адрес, документы, ID клиента или связка нескольких признаков.
Какие данные считаются PII?
ФИО, email, телефон, адрес, паспортные данные, банковские реквизиты, IP, ID клиента, геолокация, фото, голос и другие данные, которые помогают идентифицировать человека.
Почему PII важно для ИИ-агентов?
Агенты часто читают письма, документы, CRM и тикеты. Если не контролировать PII, персональные данные могут попасть в промпты, логи, trace, evals или внешние инструменты.
Чем PII отличается от sensitive data?
PII — это данные для идентификации человека. Sensitive data шире: туда могут входить коммерческие тайны, токены, финансовые данные, медицинская информация и другие чувствительные сведения.
Как безопаснее работать с PII в AI-системах?
Нужно передавать минимум данных, маскировать лишнее, ограничивать доступ, вести audit log, задавать data retention и проверять, не раскрывает ли агент PII в ответах.